Навчальні курси комп'ютерної лінгвістики у безансоні. Комп'ютерна лінгвістика у «Вишці»: Анастасія Бонч-Осмоловська про нову магістерську програму. Про курс лекцій «Комп'ютерна лінгвістика»
Культурно-просвітницький центр «Архе» запрошує на курс лекцій Олександра Чедовича Піперський «Комп'ютерна лінгвістика».
Тема першої лекції: «Основні завдання комп'ютерної лінгвістики та підходи до їх вирішення».
Машинний переклад, перевірка орфографії, класифікація текстів, розпізнавання мови та багато іншого: все це завдання комп'ютерної лінгвістики. Вирішувати їх можна різними способами: або намагаючись імітувати те, як із мовою працює людина, або сподіватися, що з усім вдасться впоратися за рахунок великих даних. Але природну мову нелегко обробляти автоматично, і цим шляхом нас підстерігає багато складнощів. До проблем входить омонімія (коли одне й те саме слово називає різні речі), синонімія (коли, навпаки, одне й те саме називається різними словами) та інші властивості людських мов, на які ми у звичайному житті навіть не звертаємо уваги.
Про лектора:
, кандидат філологічних наук, доцент Інституту лінгвістики РДГУ, науковий співробітник Школи філології НДУ ВШЕ, автор книги «Конструювання мов» (Альпіна Нон-фікшн, 2017).
Про курс лекцій "Комп'ютерна лінгвістика":
Комп'ютерна лінгвістика - одна з областей, що найбільш динамічно розвиваються на стику теорії та практики. З досягненнями комп'ютерної лінгвістики ми стикаємося щодня: це і машинний переклад, і пошук в Інтернеті, голосові помічники, і багато іншого. За кожним таким продуктом стоїть серйозна робота лінгвістів та програмістів. У ході курсу ми поговоримо про історію комп'ютерної лінгвістики та найбільш популярні її методи, а також подивимося, як вони дозволяють вирішувати важливі практичні завдання: наприклад, перевіряти орфографію або класифікувати за темами новини.
Росіяни у Франції. Враження про студентське стажування.
Доброю традицією стають травневі стажування студентів ФІЯР у Центрі прикладної лінгвістики Університету Франш-Конте у м. Безансоні (Франція). На два перші тижні місяця наші студенти вливаються до багатонаціональної компанії стажистів, яка налічує щорічно понад три тисячі осіб.
Один із найстаріших центрів навчання іноземних мов здійснює викладання не лише французької як іноземної, а й десятка інших мов. У Центрі підвищують кваліфікацію викладачі вищої та середньої школи, на його базі проводяться різноманітні наукові дослідження. На замовлення міністерств закордонних справ, посольств, міністерств освіти та інших освітніх та культурних установ фахівці Центру вирушають у відрядження та проводять свою роботу на місцях. Трохи більше року тому, 28 березня 2007 року, міністерська комісія, що складається з представників Міністерства національної освіти, Міністерства культури та комунікації, а також Міністерства закордонних справ, присудила Центру прикладної лінгвістики особливий знак якості (label FLE) – найвищий бал за п'ятьма категоріями – за заслуги у сфері викладання французької як іноземної.
Цього року наш партнер святкує свій 50-річний ювілей. Святкує з розмахом, поєднуючи співробітників Центру; стажистів; партнерів, серед яких адміністрації міста, департаменту, регіону, телевізійний канал ТБ 5, журнал "Французька мова у світі". Як свідчить один із слоганів «...де мови пов'язують і об'єднують Людей, Культури, Країни, Проекти, Надії... Саме ця ідея стане нашою червоною ниткою». Усі форми висловлювання вітаються на святах – мова, лист, поезія, графіка, звук, відео. Нашій групі видалася можливість побувати на одному із заходів, що відкривають ювілейний марафон: вернісаж робіт ліцеїстів, присвячених Центру прикладної лінгвістики.
Це перебування було багате на свята та вихідні, але ці дні ніяк не можна назвати втраченими. Поїздки до Парижа, Ліона, Діжона, Бона; участь у щорічному міжнародному фестивалі університетських музичних колективів у Бельфорі; відвідування середньовічного замку Жу, прогулянка річковим трамвайчиком до водоспаду на річці Ду із ситним обідом із місцевих страв у сільському ресторанчику: сирне фондю з кількох сортів конте, різні копченості - гордість регіону, унікальне жовте вино та чудовий домашній пиріг. Ерве Леш, керувати відділом позакласних заходів, запропонував яскраву та насичену програму. Не було позбавлено уваги пам'ятки Безансона: його музеї, фортеця, вулички, будинки, фонтани. Завдяки нашому гіду – викладачеві Центру Ф. Уабьяну – ми побачили місто зсередини.
Будні виявилися не менш насиченими: 40 годин плідної роботи під керівництвом професіоналів Центру прикладної лінгвістики Ніколь Пуар'є та Жан-Луї Кордонье з використанням мультимедійних засобів, аудіо та відео опор, текстів різних жанрів, а головне – в автентичному мовному середовищі. Пізнавальною була зустріч із представником міської адміністрації, співробітником відділу з туризму, культури та спорту Ш. Дюфетр.
Підтримка кураторів групи АМ. Стімпфлінг, М. Лакая та Ж-П Беша особливо цінна. Адже, завдяки їхній роботі, програма перебування наших студентів була добре організована, нас оточувала чудова атмосфера, а враження були найприємнішими.
Супроводжувальна група О. Крюкова
Алієва Айсель
Наприкінці зими нам запропонували поїхати на стажування до Безансону. Після недовгих роздумів усі погодились. Так, першого травня ми прилетіли до Парижа, звідки потім вирушили до столиці регіону Франш-Конте.
Перше, що вразило мене у Безансоні, це його незвичайна природа. Квіти, дерева, птахи – те, чим місто може пишатися. Саме яскраві сонячні промені та спів птахів служили мені будильником вранці. Також варто наголосити на тому факті, що нам дуже пощастило з погодою. За 14 днів перебування у Франції дощ йшов лише один раз. До речі, саме цього дощового дня ми поїхали на екскурсію до водоспадів на річковому трамваї. Все населення Безансону дуже привітне. У всіх на обличчі виблискує посмішка, кожен готовий допомогти у разі потреби.
Щодо нашого навчального процесу, то він був організований дуже добре. Насамперед, враховувалися бажання самих студентів. Так, програма навчання була спрямована на розвиток мовлення, виклад прочитаних текстів/статей. Відразу було видно, що викладачі університету прагнули зробити заняття якомога цікавішими та кориснішими. Крім навчання ми відвідали замок (Château de Joux), музичний фестиваль у Бельфорі, з'їздили до Діжона та Бона. Тож пізнавальна частина нашої програми також була насиченою. В останній день навчання ми були запрошені до відділу культури та спорту міської адміністрації, де нам докладно розповіли про різні аспекти розвитку міста: адміністративний устрій, економіка, транспорт, культура, туризм, спорт…
Ось так пройшло наше стажування у Безансоні, одному з наймиліших міст Франції. Було багато цікавого, але все описати на папері неможливо. Але можу точно сказати, що в кожному з нас залишилися свої яскраві спогади про Безансон. Всі ми згадуватимемо про нашу практику з великим задоволенням, і фотоапарат нам у цьому допоможе.
Діна Свірцова
Враження від поїздки в мене залишилися лише позитивні.
По-перше, ми змогли поспілкуватися французькою на побутовому рівні, що неможливо було б зробити під час занять в університеті. Тому поїздка була дуже корисною у плані практики мови, і завдяки їй мені стало набагато легше говорити французькою.
По-друге, ми відвідали безліч цікавих місць, таких як Діжон - надзвичайно красиве місто з безліччю пам'яток, і де стільки зелені.
Ще запам'яталася поїздка в замок «Chateau de Joux» - справжній середньовічний замок із товстими стінами, величезними гвинтовими сходами та холодним підземеллям.
Потім ми вирушили до ресторану, де скуштували фірмові страви цього регіону: фондю, ковбасні вироби та, звичайно, жовте вино.
Сильне враження на мене справила прогулянка річкою Ду, буквально за сто метрів від Швейцарії.
Що стосується самого Безансона, це дуже милий і красивий містечко, яким можна нескінченно гуляти, милуватися краєвидами і пам'ятками.
Загалом, поїздка залишила безліч хороших вражень і позитивних емоцій.
Кузнєцова Марина
Дізнавшись, що у нас є можливість вирушити на практику до Франції, наша група жила лише мріями та надіями. У лютому ідея про те, що в травні на нас чекає подорож, здавалася якоюсь нереальною і далекою, але мрії збуваються і voilà ми вже в Безансоні. Перше враження про це місто: Боже, яка тут природа, які дерева, квіти. Все цвіте!". З першого дня, незважаючи на втому, хотілося гуляти. На мій погляд, неможливо описати почуття, які ми відчували усі ці два тижні. Нескінченне захоплення та бажання забути, що ти іноземець і турист, злитися з натовпом городян та відчути себе частиною міста; намагатися поводитися як французький студент: купувати квитки на автобус і на поїзд, заходити в булочні та насолоджуватися запахом свіжоспеченого хліба, бути чемним з людьми, які тебе оточують.
Дні летіли зі швидкістю світла. І ось, нам уже час збирати валізи і їхати до Росії. Подвійне почуття: звичайно, всі ми скучили за своїми близькими, але все ж таки, я впевнена, що кожен з нас залишився б тут ще. Залишати місце, де єдиною проблемою є брак часу на те, щоб побачити і відвідати все, не хочеться, адже в Москві на нас чекають повсякденні проблеми та літня сесія. Безансон - дуже спокійне і тихе місто, тут я почувала себе як на курорті, особливо це відчувалося рано вранці, коли сонце освітлювало вулиці та дерева.
Але все ж таки ми були на практиці, тому доводилося не лише відпочивати та розважатися, а й серйозно займатися. Наші викладачі були дуже уважними, вони завжди були готові нам допомогти, відчувалася їхня зацікавленість у тому, щоб навчити нас чогось нового. До того ж, поповнився і наш словниковий запас, т.к. часто ми знаходилися в досить складних ситуаціях, вихід з яких знайти без знання деяких понять було дуже складно, але ми завжди справлялися!
Це дуже приємно! Отримуєш нереальне задоволення, коли вимовляєш щось французькою і бачиш, що люди тебе розуміють. Відразу з'являється бажання говорити французькою з усіма.
На завершення я хочу сказати, що практика в Безансоні допомогла мені вивчити багато нових виразів, відчути себе причетною до повсякденного життя міста, подолати у собі сором'язливість і почати спілкуватися і, звичайно, всі ми, по приїзді до Москви, показуватимемо своїм батькам та друзям фотографії та розповідати про нашу подорож. Купа спогадів, які не хочеться забувати!
Сподіваюся, що наступного року ми матимемо ще одну можливість відвідати Францію. А тепер, у Москві, нам варто старанно займатися та вдосконалювати наші знання.
Я хочу сказати велике спасибі тим, хто втілив наші мрії в реальність і організував цю чудову двотижневу поїздку в одне з найбільш, на мою думку, красивих і затишних міст Франції, а саме, в місто Безансон.
Крюкова Ніна
Для мене це перша подорож до Франції - виконання дитячої мрії, сон, що нарешті здійснився.
Старовинні мостові міста, сонце в бризках фонтанів, яких у Безансоні дуже багато, черепичні дахи будинків, зелені пагорби, старовинна (і вічна, як пишуть у буклетах) цитадель, збудована Великим Вобаном і що зберігає пам'ять про минулі століття і війни - все це настільки що здається сном. Ти йдеш містом і думаєш, що зараз прокинешся, бо не може бути на світі такої краси і такого чарівництва. Виявляється, може.
У цьому місті на одній площі в одному будинку народилися брати Люм'єр та Шарль Надьє, а в будинку навпаки – Віктор Гюго. Над цією площею височить на саму цитадель, і сонце грає відблисками на різнобарвному даху кафедрального собору. Тут історія сплелася з сучасністю, і здається, що Безансон має особливі стосунки з вічністю, адже музей Часу знаходиться саме там.
Крім уроків у Центрі прикладної лінгвістики (CLA), на яких час пролітав непомітно, ми могли подорожувати Францією, чим, власне, і займалися під час численних травневих свят. Ми були в Діжоні, Ліоні, Бельфорі, і про кожне з цих міст можна написати томи по три захоплені враження.
Стародавній Діжон з вузькими середньовічними вуличками, зі шпилями готичних соборів, що прагнуть у небо, з різнокольоровими дахами будинків, які пам'ятають ще лицарів і Бургундське герцогство, собор Notre-Dame de Bourgogne, в якому знаходиться статуя Діви Марії, створена в Башня Башня. Доброго, з якого видно, наче на долоні, все місто… О, про Діжона можна говорити нескінченно.
Ліон, місто контрастів, що стоїть на двох річках.
Бельфор, де відбувається щорічний музичний фестиваль, який об'єднує всіх, незалежно від віку та рідної мови.
Середньовічний замой Joux, де у дружбі з господарем замку та в коханні з його дружиною вільно жив Мірабо, де загинув Туссен Лувертюр, де кожен камінь має свою історію, свої легенди.
Про все не розповіси, всього не перерахуєш. Але нескінченно прекрасна Франція, дивовижні викладачі, на уроках яких годину пролітає, як хвилина, виразна лекція алжирського письменника А. Джемая про творчість Камю - ми ніколи не забудемо про два тижні, проведені тут.
Піду збирати валізи і мріяти про те, щоб ще не раз повернутися в Безансон.
Шпилянок Євгенія
Безансон – це невелике гостинне місто на сході Франції. Це не було моєю першою поїздкою до Безансона, але, тим не менш, це місто відкрилося для мене з нового боку.
У Безансоні напрочуд гармонійно поєднуються незаймана природа та міський пейзаж: жителі міста у вихідні гуляють набережною річки Ду, а в будні ведуть урбаністичний спосіб життя.
Влада Безансона та його мешканці дуже відповідально підходять до справи захисту навколишнього середовища. Так, що стосується громадського транспорту, більшість автобусів їздять на природному газі.
За час перебування у Франції ми відвідали не лише Безансон, а й Діжон, який перебуває за годину їзди від нього. Ми також провели чудовий день у замку Château de Joux. Після екскурсії замком ми поласували фондю, а потім на прогулянковому катері вирушили на водоспад Le Saut du Doubs, який знаходиться на кордоні зі Швейцарією. Отже, можна сказати, що, не докладаючи особливих зусиль, ми побували у Швейцарії.
Нарешті ми відвідали студентський музичний фестиваль у маленькому містечку Бельфор. Там було представлено безліч талановитих гуртів різних музичних стилів та напрямків.
Що стосується занять у Центрі прикладної лінгвістики (CLA), то слід зазначити професіоналізм викладачів, їхню готовність пояснити незрозумілі речі та дати нові знання. Ми аналізували вірші, дивилися та розбирали фільм, займалися аудіюванням та влаштовували дебати.
У цій поїздці ми краще впізнали одне одного, а також познайомилися з новими цікавими людьми, з якими нам, напевно, захочеться спілкуватися й надалі.
Франція зустріла нас чудовою погодою. Ми насолоджувалися теплом та сонцем, засмагали, гуляли та дихали чистим повітрям Безансона.
Єдине, що мене бентежить у Франції - це повна відмова магазинів та інших закладів, що надають послуги, працювати у неділю та святкові дні. Для нас це особливо відчутно тому, що на наше перебування їх випало дуже багато.
Загалом я вважаю, що наша поїздка вдалася, тим більше, що вона, швидше за все, була останньою у моєму студентському житті.
Кашицин Ігор
Ось уже зібрані валізи, не забуті документи, і диво французької техніки - TGV з величезною швидкістю мчить нас із гостинного та вже майже свого Безансону до величезного Парижа. Два тижні у Франції пролетіли з такою самою блискавичністю, що і той самий швидкісний поїзд - Train à grande vitesse. Складно систематизувати всі враження, але серед них залишилися найяскравіші.
Перше, що впадає у вічі - у крилатій фразі “у Греції все є” у ХХІ столітті можна сміливо змінити назву країни Францію. Скрізь відчувається, що Франція за всього свого космополітизму свято шанує власні традиції та відособленість. Місцеві жителі їздять на зручних французьких автомобілях, заслужено пишаються французькою їжею, яка справді найвищої якості, готові цілими днями захоплюватися своєю мовою та своєю природою.
Сам Безансон виявився майже таким, як я його й уявляв, але це зовсім не означає, що він мені не сподобався.
Навпаки, у місті зберігся дух Середньовічної Франції - з її церквами, брукованими вулицями, маленькими двориками, в яких французи проводять вечори за келихом вина.
Безансон для мене – це імена та назви: брати Люм'єр, Гюго, «Червоне та Чорне» (написаний Стендалем, а не Гюго, як я вважав колись). Червоне - це велична цитадель Вобана, з якої відкривається незвичайний вид на долину річки Ду, численні бастіони, мости, які під час війни піднімалися і робили місто практично неприступним. Навіть назва одного із кварталів міста - Battant побічно говорить про велике минуле міста. Чорне – це сутана католицького священика. Якщо пам'ятаєте, Жюльєн Сорель збирався вступати до семінарії саме у Безансоні. Це вражаючий кафедральний собор, церква Св. Мадлен, підніжжя якої перетворилося на місце зустрічі та обіду безансонських студентів.
Безансон надзвичайно зручно розташований, а розвинені шляхи сполучення дозволили мені за досить короткий термін подивитися не тільки саме місто з його околицями, а й відвідати Бургундію та її дуже гарну столицю Діжон, місто-мрію Ліон, весь центр якого є частиною всесвітньої спадщини, і навіть на 5 хвилин зайти до Швейцарії після екскурсії у гори Юра.
Жителі сходу Франції виявилися для мене несподівано відкритими та гостинними, що чудово поєднувалося з їхнім вродженим інтелектом та бездоганним знанням етикету. Хочеться від щирого серця подякувати стороні, що приймала, весь Центр прикладної лінгвістики (CLA) і особливо наших викладачів. Усім дуже дякую!
P.S. Окреме дякую кафедрі та факультету
і невелике побажання: а чи можна нас тепер на захід?! =) У Бордо, Нант або Тулузу =)
Будульчієва Наталія
Безансон став для мене таким містом, в якому забуваєш про існування Москви та Парижа - мегаполісів, які пригнічують людину гігантськими розмірами та небом, далеким і нереальним. Хтось скаже, що все, що було з нами в Безансоні – сон чи казка, але мені це місто здалося набагато реальнішим, ніж якесь інше, бо вода в ньому – справді вода, а зірки близькі та яскраві.
Майже половина днів, проведених у Франції, виявились святковими. Завдяки цій обставині, у нас було більше часу, щоб самим поблукати Безансоном, з'їздити в сусідні міста. Останнє захопило мене найбільше: лише одну-дві години їзди на швидкісному поїзді, і ти в Діжоні, або в Ліоні, або в Бельфорі. Та де завгодно! Франція справді маленька країна, але завжди дивовижно різна. Забавно було з'їздити в один день до Шато де Жу, справжнього середньовічного замку-фортеці, а другого дня опинитися в Бельфорі на фестивалі університетської музики.
Відкриттям для мене стали заняття у центрі прикладної лінгвістики. Це було справді захоплююче: вивчення текстів сучасних пісень, фільмів, читання популярних у Франції поетів. Було цікаво, нарешті, просто поспілкуватися з викладачами, дізнатися, де в Безансоні є найкращі кондитерські, або, наприклад, де і як любить відпочивати місцева молодь.
Яна Щербина
Для мене це перше знайомство з Безансоном та Францією. Знайомство дуже довгоочікуване та приємне. Перше, що помічаєш у Безансоні, - це відсутність пробок на дорогах, так властивих Москві. Та й машин у Безансоні мало – місцеві жителі воліють велосипеди – користь і для здоров'я, і для екології. Немає машин - немає і шуму, і повітря помітно чистіше. У місті багато дерев та квітів, велика кількість фонтанів.
Французи вміють зберігати свою історію, тому будинки XVIII, XIX століть у прекрасному стані та придатні для житла, а ось сучасні споруди у цьому місті – рідкість.
Не можна не сказати і про мешканців міста. На мій погляд, це найввічливіші, найдобріші люди. За весь час, проведений мною в Безансоні, я не помітила, щоб хтось учинив скандал чи просто підвищив голос. Дивує мила звичка французів вітатись з усіма: і знайомими, і незнайомцями.
Загалом, Безансон варто побачити на власні очі, і я сподіваюся, що я туди повернуся ще не раз.
Кірдяшев Іван
Нема відчуття, що ми в іншій країні. Просто люди говорять іншою мовою, що вже стала майже рідною. Поки що незрозумілий сенс того, що відбувається, але здається, ми вже у Франції.
… Декількома годинами пізніше. Район "Gare de Lyon". Площа Бастилії.
Нічний Париж виявився брудним, трохи маргінальним, небезпечним, але водночас привітним та зеленим містом. Будучи вигнаними з вокзалу разом із валізами, в холодну ніч ми намагалися знайти тепле вогнище і зручне стілець. У підсумку ми влаштувалися на веранді кафе з цілком грізною назвою "Bastilia". Бідолашний офіціант, який нас обслуговував, просто не знав що робити о пів на четверту ранку з дванадцятьма замерзлими і голодними росіянами. Цієї ночі ми відчули себе справжніми мандрівниками.
5 годинами пізніше ми влаштувалися у досить зручному кріслі (а головне теплом!) у TGV та поїхали до нашого призначення.
Пахуча французька провінція. Трохи «à côté», як висловлюються місцеві, однак нітрохи не втрачає своїх достоїнств, а саме:
- У місті чисто та зелено. "Besançon est une ville propre" - декларують місцеві урни.
- Дивовижна ввічливість французів! Я вражений!
- 6 годин язика на день. Можна здуріти! Від щастя. Переживаю катарсис щовечора.
Лещенко, російський гімн та компанія з 10 осіб у тісному номері. Сімнадцятиразове "ура!" і вже наступного ранку про нас знає весь гуртожиток. Словом, це особлива історія про міжкультурне спілкування.
У містечку Belfort на півночі регіону проходив фестиваль музики, на який ми вирушили. На шляху нам зустрілися заводи Peugeot у Montbeillard. Незабутнє видовище мощі французької промисловості. Belfort, на жаль, виявився не «біль», а «саль». Мабуть, кілька днів фестивалю та присутність значної кількості людей (а надто молоді!) може споганити будь-яке місце.
Проте виступи гуртів різних країн, музикантів різної кваліфікації - від студентів празької консерваторії до бродячого студентського оркестру з Португалії створило особливий, навряд чи забутий колорит дійства.
Воістину саме тут найбільше оголюються відцентрові сили матінки-Європи. Вона така різна, але таки єдина!
Останній урок із улюбленим викладачем. Символічний обмін подарунками та читання вірша, що ставить фінальний, трохи сумний акорд нашого навчання. Лірично. Сумно. Прощавай, Besançon.
Sans doute je reviens. J'espère donc je suis.
Ранній поїзд і день у Парижі. Дивом вдалося потрапити до Notre Dame de Paris. Там – натовпи напіводягнених туристів з відсутнім виглядом висвітлюють вітражі спалахами своїх «мильниць». Це місце наводить і ворожість, і благоговійне обожнювання одночасно.
Знайомство з паризьким метро пройшло невдало – довелося хитрістю подолати турнікет. Так, Russo Turisto! Потім ми вирушили в той же аеропорт де Голля, який я вважаю тепер найкращим з коли-небудь бачених.
Merci à toi, chère République Française.
FIN
Пильцина Марія
Безансон з першого погляду вражає своїми високими дахами та вузькими брукованими вуличками. Полонить своїм затишком і безтурботністю. Перший раз я побувала в Безансоні два роки тому, і вже тоді місто запало мені в душу. Начебто нічого особливого, але є щось таке, що змусило мене знову повернутися до столиці Франш-Конте. Після першої поїздки я прочитала книгу Стендаля «Червоне та Чорне», де частина дій розгортається саме в Безансоні. І тому під час другого візиту мене дуже цікавив Безансон Жульєна Сореля. Під час екскурсії містом з мосьє Уаб'яном ми відвідали семінарію, до якої збирався вступати Жюльєн.
Дуже приємно порадувала погода. Приємно згадувати численні пікніки на траві в тіні платанів і стіни фортеці прямо біля самої води спокійної Ду.
Заняття в центрі прикладної лінгвістики CLA щоразу вражали різноманітністю. Ми встигли ознайомитися та проаналізувати кілька віршів французьких авторів, подивитися фільм «Амелі», і навіть опанувати жаргонну мову сучасної французької молоді.
Наприкінці поїздки страшенно не хотілося їхати. Але сподіватимемося, що це наш не останній раз у Безансоні, і ми обов'язково знову відвідаємо це спокійне, затишне та чарівне місто та його добрих, відкритих та привітних мешканців.
Комп'ютерна лінгвістика - одна з областей, що найбільш динамічно розвиваються на стику теорії та практики. З досягненнями комп'ютерної лінгвістики ми стикаємося щодня: це і машинний переклад, і пошук в Інтернеті, голосові помічники, і багато іншого. За кожним таким продуктом стоїть серйозна робота лінгвістів та програмістів. У ході курсу ми поговоримо про історію комп'ютерної лінгвістики та найбільш популярні її методи, а також подивимося, як вони дозволяють вирішувати важливі практичні завдання: наприклад, перевіряти орфографію або класифікувати за темами новини.
Орієнтовний план курсу:
1. Вступ: основні завдання комп'ютерної лінгвістики та підходи до їх вирішення.
2. Обробка рядків за допомогою регулярних виразів.
3. Лінгвістичні корпуси та їх кількісний аналіз.
4. Морфологічна та синтаксична розмітка. Мовні моделі.
5. Перевірка орфографії.
6. Машинний переклад.
7. Класифікація текстів.
8. Генерація природної мови. Загальні засади оцінки якості роботи комп'ютерно-лінгвістичних додатків.
Лектор: Піперски Олександр Чедович, кандидат філологічних наук, доцент Інституту лінгвістики РДГУ, науковий співробітник Школи філології НДУ ВШЕ.
Вартість однієї лекції – 500 рублів. Знижки: студенти (50%), школярі (70%)
Абонемент на курс (8 лекцій) - 3500 рублів [студенти - 2000р; школярі - 1200р].
Після закінчення курсу видається сертифікат (тільки для слухачів, які відвідують заняття з абонементу).
А також ми організуємо пряму трансляцію лекції:
Вартість трансляції однієї лекції
200 рублів.
Сплатити можна через Тайм Пад:
Задати питання та сплатити трансляцію іншим способом можна, написавши на пошту: [email protected]
Лекції проходитимуть за адресою: Москва, м.Спортивна, вул.Мала Пироговська, д.29/7 (ІФТІС МПГУ)
Отримати більш детальну інформацію про курс можна за телефоном: 8-495-088-92-81
Записатися на курс ви можете поштою.
Завідувач УНЦ
Загальна інформація
УНЦ комп'ютерної лінгвістики було відкрито в Інституті лінгвістики РДГУ у 2011 році за участю компанії ABBYY та підтримки російського відділення IBM. УНЦ готує професійних лінгвістів, здатних ефективно працювати у галузі розробки інноваційних мовних комп'ютерних технологій. З 2012 року УНЦ здійснюватиме підготовку магістрантів за програмою «Комп'ютерна лінгвістика» напряму «Фундаментальна та прикладна лінгвістика».
Комп'ютерна лінгвістика є відносно новою галуззю наукової та інженерної діяльності. Актуальність створення даної магістерської програми визначається тим, що в останні 10-15 років спостерігається бурхливий розвиток цієї галузі, пов'язаний з впливом Інтернету і появою величезної кількості нових технічних пристроїв, найважливішою частиною яких є природно-мовні інтерфейси. Крім того, у сучасній лінгвістиці відбувається стрімкий перехід від традиційних методів отримання мовних даних до корпусних методів, що потребують серйозного розвитку комп'ютерних технологій.
Очевидна, зростаюча з року в рік потреба у фахівцях, здатних брати участь у розробці відповідних технологій, не підкріплена ще, на жаль, наявністю адекватного освітнього стандарту системі російської освіти. Пропонована програма є однією з перших спроб визначення того, які саме фахівці потрібні галузі.
Область діяльності, пов'язана з вирішенням завдань автоматичної обробки Природного Мова (ЄЯ) та іменована «Комп'ютерна лінгвістика», вимагає підготовки фахівців двох напрямків, що принципово відрізняються: лінгвістів та інженерів. Ці напрями базуються на двох абсолютно різних системах освіти:
- "Комп'ютерна лінгвістика для інженерів" є частиною т.зв. Computer Science. У рамках цього напрямку готуються інженери, здатні ефективно вирішувати завдання автоматичної обробки ЕЯ, спираючись на необхідні для конкретного завдання існуючі лінгвістичні ресурси та моделі. УНЦ сприяє появі таких спеціалістів, взаємодії з технічними вишами. Зокрема, за участю УНЦ комп'ютерної лінгвістики РДГУ створюється «паралельна» магістерська програма з комп'ютерної лінгвістики для інженерів МФТІ.
- "Комп'ютерна лінгвістика для лінгвістів" є розділом теоретичної та прикладної лінгвістики. У рамках цього напряму готуються лінгвісти, здатні вирішувати завдання створення формальних мовних моделей та виконаних на їх основі лінгвістичних ресурсів, що володіють необхідними властивостями для їхнього застосування в завданнях автоматичної обробки ЕЯ. Саме цей напрямок реалізується магістерською програмою «Фундаментальна та комп'ютерна лінгвістика», створеною силами УНЦ.
Найважливішим обставиною і те, що фахівці, підготовлені у цих двох напрямів, є необхідними учасниками будь-яких серйозних проектів у сфері автоматичної обробки ЕЯ. І хоча вони виконують функції, що істотно розрізняються, вміння ефективно взаємодіяти між собою є ключовим фактором в успіху таких проектів. Основи такої взаємодії закладаються у програмах за рахунок серйозної інженерної та математичної підготовки лінгвістів (і відповідної лінгвістичної підготовки інженерів).
Таким чином, підготовка магістрів з комп'ютерної лінгвістики в даній програмі ґрунтується на глибокому вивченні фундаментальних основ лінгвістики з акцентом на методах створення операційних формальних моделей мовної системи, адекватних складності таких завдань обробки природної мови, як розпізнавання та синтезу мови, машинний переклад, семантичний аналіз та розуміння. текст, інтелектуальний пошук.
Специфіка УНЦ відображена у наступних розділах:
1. Формальні моделі мови (з упором на перспективах прикладного використання);
2. Інструментальний напрямок: спеціалізовані мови та пакети для лінгвістів (типу NLTK, R тощо), наявні ресурси (від граматик та парсерів до онтологій);
3. Прикладний напрямок (окремі важливі завдання NLP, як вирішуються, як використовується лінгвістика);
4. Математична та інженерна підготовка. Статистика, формальні граматики, уявлення про методи машинного навчання.
Магістрантам напряму «Комп'ютерна лінгвістика» УНЦ читає такі курси:
- Математичні засади комп'ютерної лінгвістики. Оглядовий курс основних математичних методів, що застосовуються у комп'ютерній лінгвістиці: математична логіка; теорія ймовірностей та статистика; формальні граматики; теорія алгоритмів, зокрема – поняття складності алгоритму; машинне навчання;
- Програмування лінгвістичних завдань (NLTK та R). Завдання курсу – навчання студентів роботі з доступними інтерпретаторами на основі мови Python. Короткий вступ у методи програмування загалом;
- Загальна та комп'ютерна лексикографія (за програмою Lexicom). Курс знайомить студентів із принципами сучасної системної лексикографії; з новими методиками лексикографічної роботи, включаючи корпусні методи. Розглядаються сучасні комп'ютерні системи створення словників, аналізуються нові тенденції у лексикографії (віки-проекти, експертні методи оцінки філії тощо);
- Моделі та методи автоматичної обробки тексту (NLP/АОТ). Оглядовий курс, що складається з двох частин (матричний, з різними лекторами): основні лінгвістичні моделі + основні задачі, що вирішуються. Курс методично пов'язаний із курсом «Математичні основи лінгвістичних досліджень». Перша частина курсу носить резюмуючий характер і спирається на системні знання про мову, отримані магістрами під час навчання в бакалавріаті з лінгвістичних спеціальностей (ці знання є необхідними для складання вступного іспиту);
- Лінгвістичні та онтологічні моделі. Ідеологічно дуже важливий курс, що перекидає місток між лінгвістичними та екстралінгвістичними моделями. У курсі розглядається інтерфейс між лексико-семантичними та онтологічними описами (зокрема, проект Ігоря Богуславського). Аналізуються сучасні лінгвоонтологічні ресурси (*net), сучасні проекти «мепінгу» між ними (Марта Палмер і К);
- Корпусна лінгвістика. Розглядаються проблеми створення та оцінки корпусів. Інтернет, як корпус. Методи автоматичного створення корпусів. Аналіз методів використання корпусів у лінгвістичних дослідженнях (оцінка значущості одержаних статистичних результатів).
- Лінгвістичне анотування та розмітка. Мови та методи розмітки, починаючи з XML. Ідеологічно близько курсу Хові;
- Машинний переказ;
- Методи оцінки NLP-додатків;
- Формальні моделі та ресурси основних світових мов (неіндоєвропейських);
- Інформаційний пошук;
- Питання-відповіді системи (спецкурс IBM);
- Спеціалізовані лінгвістичні бази даних.
Студентам Інституту Лінгвістики (спеціаліст, бакалаврат, магістратура) УНЦ читає такі курси:
- Введення у комп'ютерну лінгвістику;
- Комп'ютерна лінгвістика. Основні завдання та технології;
- Сучасні методи соціолінгвістики;
- Автоматичний переклад
- Лінгвістичні засади машинного перекладу;
- Основи інформатики;
- Основні напрямки лінгвістичного забезпечення нових інформаційних технологій (комп'ютерний аналіз текстів);
- Інформатика та інформаційні технології у лінгвістиці;
- Автоматична обробка природної мови;
- Автоматична обробка тексту; Автоматична генерація текстів-описів зображень;
- Комп'ютерне забезпечення перекладацької діяльності;
- Корпусна лінгвістика.
Студенти проходять практику у компанії ABBYY.
також сторінку УНЦ комп'ютерної лінгвістики на сайті компанії ABBYY.
Список працівників УНЦ комп'ютерної лінгвістики
Володимир Павлович Селегей – директор із лінгвістичних досліджень компанії ABBYY, завідувач УНЦ комп'ютерної лінгвістики
"Введення в комп'ютерну лінгвістику"
Отже, комп'ютерна лінгвістика – молода, але дуже перспективна наука. А головна особливість цієї науки в тому, що вона вважається міждисциплінарною, тобто вивчає проблеми, що стоять на стику програмування та мовознавства. І для того, щоб стати повноцінним фахівцем у цій галузі, потрібно добре розбиратися і в математиці, і в лінгвістиці.
Програми навчання поділяються на програми для філологів, які хочуть пов'язати своє життя з лінгвістичними розробками в IT, а також для математиків, які бажають працювати над системами розпізнавання тексту, перекладацькими програмами тощо. Ми зупинимося на другому варіанті.
Відразу хочу обмовитися, що таких магістратур у Росії - одиниці, і зазвичай вони займаються компаніями, що займаються лінгвістичними розробками. Більшість програм, присвячених комп'ютерній лінгвістиці, знаходяться у столицях.
Почну з тієї магістратури, яка видалася мені найцікавішою. Вона знаходиться в Санкт-Петербурзі, на базі СПбДУ на кафедрі інформаційних систем у мистецтві та гуманітарних науках. Хочу одразу наголосити, що кафедра знаходиться на гуманітарному факультеті, але розрахована саме на програмістів. Освітня програма називається «Інженерія гуманітарних знань». Цільова установка магістратури – (цитую сайт) «підготовка фахівців, здатних брати участь у дослідній та проектній роботі в галузі інтелектуальних інформаційних технологій зі спеціалізацією у напрямі мовної інженерії, технологій отримання гуманітарних знань з текстового потоку, онтологічної інженерії».
Щоб туди вступити, потрібно скласти письмовий тест, у якому будуть питання з математики, основ програмування та (трохи) з мовознавства. Налякатися питань з останньої дисципліни математикам не варто: судячи зі списку літератури, двох-трьох нескладних книг, під назвою «Введення у мовознавство», цілком вистачить, щоб здати вступні випробування. Зі власних джерел мені стало відомо, що курує цю освітню програму компанія Яндекс, правда на сайті магістратури про це не згадується.
Друга магістратура, про яку хотілося б розповісти, знаходиться в Москві на кафедрі розпізнавання зображень та обробки тексту факультету інновацій та високих технологій (ФІВТ) у МФТІ. Вона була заснована у 2006 році компанією ABBYY. Судячи з опису, з кількох програм магістратури, пропонованих цією кафедрою, до комп'ютерної лінгвістики найбільше належать напрями «Інтелектуальні системи» та «Методи машинного навчання». Щоб потрапити туди вчитися, потрібно не лише скласти вступний іспит, а й пройти співбесіду зі співробітниками компанії ABBYY. Все ж таки в ABBYY розраховують, що потім випускники підуть працювати до них.
І остання магістерська програма, про яку я розповім, так і називається «Комп'ютерна лінгвістика» та знаходиться на факультеті філології ВШЕ. Як випливає з здобутої мною інформації, вона є у Москві та у Нижегородському відділенні Вишки. Представники університету вважають, що ця програма підходить не лише для математиків, а й для випускників з іншою базовою освітою. Навчання передбачає як курси з програмування, покликані підтягнути випускників гуманітарних спеціальностей, і курс загальної лінгвістики, розрахованої на математиків.
Щоб вступити до цієї магістратури, потрібно скласти іспит з іноземної мови та оформити портфоліо, в якому має бути мотиваційний лист та інформація про майбутнього студента. Потрібно буде розповісти про свої професійні інтереси, публікації, практики, які проходив і т.д. Викладачами будуть працівники факультету філології, загальноуніверситетської кафедри вищої математики, відділення прикладної математики та інформатики, базової кафедри Яндекса.
Загалом вибір у випускників, які вирішать займатися комп'ютерною лінгвістикою, є. Поки що він невеликий, але, гадаю, у майбутньому таких програм стане набагато більше.
Думаю, на цьому закінчити огляд.
За допомогу в підготовці статтю дякую Яндекс і Гугл, офіційний сайт компанії ABBYY, а також сайти вишів, про які йшлося у пості.