СТАТЬИ АРБИР
 

  2018

  Октябрь   
  Пн Вт Ср Чт Пт Сб Вс
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30 31 1 2 3 4
   

  
Логин:
Пароль:
Забыли свой пароль?


Компьютерная лингвистика и ее современное значение


КОМПЬЮТЕРНАЯ ЛИНГВИСТИКА И ЕЕ СОВРЕМЕННОЕ ЗНАЧЕНИЕ

В статье рассмотрены понятия и особенности развития компьютерной лингвистики. Актуальность темы работы сопряжена, прежде всего, с тем, что в настоящее время компьютерная лингвистика является одной из динамично развивающихся отраслей теоретического знания.

Под компьютерной лингвистикой понимается изучение языка как абстрактной знаковой системы с целью построения теоретической основы компьютерных лингвистических исследований и создания конкретных алгоритмов в лингвистической семантике текста. В таком понимании математическая лингвистика составляла часть семиотики - общей теории знаковых систем.

Эволюция средств формального представления лингвистической информации может быть грубо разбита на следующие этапы: процедурные модели 70-х годов, построенные на механизмах, подобных ATN; унифи- кационные модели 80-х годов, например, PATR или GULP, которые использовали декларативное представление; и структуры типизированных признаков 90-х годов, которые являются одновременно структурами данных и описаниями ограничений для унификации. Кроме того, активное использование объектно-ориентированной методологии связано с тем, что многие лингвистические понятия естественно выразимы в терминах наследования. [3, с. 16].

Еще один сдвиг, тесно связанный с парадигмой использования ограничений - переход от анализа, основанного на правилах, к анализу, использующему принципы сформированности языковых конструкций. В результате вместо точного задания способов выражения некоторого языкового феномена лингвист, описывая грамматику, получает возможность сформулировать некоторые непротиворечивые соображения относительно этого феномена, одновременное применение которых позволяет полностью его описать. Грамматика в такой парадигме становится эпифеноменом, что приводит к уменьшению сложности описания и переходу от задания конкретных видов структуры к принципам ее построения.

Интерес к экстралингвистическим знаниям связан также с активными в последнее время исследованиями лингвистических феноменов, возникающих из-за специфики подъязыков различных предметных областей, которые ведут к необходимости адаптации общеязыкового грамматического представления в соответствующей предметной области. Введение элементов грамматики зависимостей в структуры составляющих, ранее доминировавших в англоязычной традиции, характеризует активизацию интереса в теоретической компьютерной лингвистике к таким аспектам языка, как управление, разрывность составляющих, свободный порядок слов и т.п.

Таблица 1 - Фрагмент фрейма "стол" в табличном представлении

Имя слота
Содержание слота
1. Количество ножек
четыре, возможно больше, минимум три
2. Материал
дерево, пластмасса, стекло
3. Поверхность
прямоугольник, овал, круг, квадрат
4. Наличие тумб
факультативно
5. Функции
обеденный, журнальный, рабочий и пр.

В теории знаний для изучения и представления используются различные структуры знаний - фреймы, сценарии, планы. В целях наглядности фрейм часто представляют в виде таблицы, строки которой образуют слоты. Каждый слот имеет свое имя и содержание (Табл. 1).

В зависимости от конкретной задачи структуризация фрейма может быть существенно более сложной; фрейм может включать вложенные подфреймы и отсылки к другим фреймам.

Для современных разработок характерно также стремление к интеграции различных лингвистических средств, которые уже были разработаны. Эта интеграция может включать в себя совместимость описаний в различных видах грамматик. Одним из наиболее крупных примеров является LFG, когда была разработана целая лингвистическая теория благодаря стремлению использовать описания, которые были сделаны в трансформационной грамматике Хомского. Примером взаимообогащения парадигм могут служить переносы грамматических описаний между HPSG и категориальной унификационной грамматикой. Другая возможность интеграции связана с использованием не зависящих от теории онтологий, какими, например, являются лингвистически-мотивированные онтологии Upper Model или проект Lilog.

Понятно, что подобные интеграционные интересы обусловлены очень большим количеством разработок в области компьютерной лингвистики, накопившихся за последние 25 лет. Еще одна форма повторного использования компонентов, применяющаяся в рамках одной теории, появилась в связи с активным использованием унификации, которая позволяет определять операции построения лингвистических структур в двух направлениях - и для генерации, и для синтеза. Это приводит к возможности построения грамматик двойного назначения, разрабатываемых во многих проектах. Одним из примеров полностью двустороннего описания является двухуровневая морфология [4, с. 38].

Сама по себе машинная обработка любых текстов может быть осуществлена только с использованием сверх лингвистических технологий, которые способны анализировать информацию на уровне понимания основного смысла как обычный человек.

Современные технологии автоматического перевода пытаются объяснить значение каждого слова в предложении, поднимаясь в пирамиде на уровень семантики. Это помогает уточнить перевод, так как отметаются гипотезы, в которых не согласуется семантика отдельных слов. Постепенное развитие инструментальных средств разработки грамматик приводит к появлению такого понятия, как лингвистическое программное обеспечение.

До настоящего времени программные средства, предназначенные для лингвистических разработок, не могли быть сопоставлены с такими средствами, как среды программирования или системы автоматизированного проектирования, используемые в инженерных разработках.

В течение последних лет (начиная примерно с 1992 года) в лингвистическом сообществе достаточно активно разрабатывается идея о необходимости инструментальных лингвистических средств, сравнимых с промышленными системами по возможностям, связанных с разработкой грамматик коллективом исследователей, отладкой построенных представлений в графических средах и их автоматическим тестированием на базе значительного корпуса тестов.

Ученые полагают, что функционирование естественного языка в процессе коммуникации в среде Интернет должно стать объектом собственно лингвистического системного анализа и осуществляться в рамках системно-функционального подхода, а функционирование веб-страницы в Интернете представляет собой сложный семиотический процесс. Использование здесь языковых средств должно оцениваться с точки зрения семантики, синтактики и прагматики [1, с. 36].

Компьютерная лингвистика совместно с кибернетикой, к сожалению, так и не смогла изобрести совершенный машинный перевод или создать «умную» диалоговую систему. Научно-технический прогресс расставил все по своим местам. И ученые, работающие в то время, смогли доказать, что решение проблемы «машинного мышления» может быть осуществлено только при полном понимании процедуры работы естественного сознания. И только в этом случае исследователи смогут все процедуры мышления подвергнуть компьютерной алгоритмизации. Другими словами, автоматическая обработка информации будет способствовать новому представлению мышления человека.

При осмыслении любого сообщения людьми никогда не сопоставляется полученная информация с моделями и понятиями поведения образов, которые находятся в памяти. При каждой получаемой модели человек в памяти обнаруживает соответствие в накопленном опыте, и только потом при дальнейшем переосмыслении текста начинает конкретизировать и уточнять полученную информацию. В отличие от изложенного, компьютерная лингвистика направлена на установление точного соответствия значений слов, пытаясь при этом преодолеть проблемный вопрос многозначности инструментариев в виде слов, которые свойственны любому языку. Именно это и отличает рассмотренное понятие от действия мышления человека. Существует мнение, что человек понимает текст или речь не за счет особых знаний морфологических нагрузок или установления синтаксиса между словами, а посредством изначальных ассоциативных предположений для формирования картины воспринимаемой информации в соответствии с ее внутренним содержанием.

Таким образом, компьютерная лингвистика, будучи одним из направлений прикладной, изучает лингвистические основы информатики и все аспекты связи языка и мышления, моделирования языка и мышления в компьютерной среде с помощью программ. Проблемы языковой коммуникации "человек - компьютер - человек" и моделирования языка лежат в области исследований такой молодой науки, как компьютерная лингвистика, которая образовалась на стыке информатики и лингвистики.

Список литературы

Шейгал Е. И. Компьютерный жаргон как лингвокультурный феномен / В. И. Карасик // Языковая личность: культурные концепты. - Волгоград: Перемена, 2013.

Кузьменко И.П., Гурова Е.А. Информация как естественный ресурс экономического роста // Вестник АПК Ставрополья. 201Е №.2.С.71-74.

Кузьменко И.П., Никитенко Т.В., Тимошенко Л.И. Информационная составляющая механизма процессного управления/Культура и общество: история и современность материалы II Всероссийской (с международным участием) научно-практической конференции, под редакцией: Колосовой О.Ю., Гударенко Р.Ф., Ряснянской Н.А., Красиковой Е.А. 2013. С. 196-199.

Гурова Е. А., Петриевский И. В., Кузьменко И. П. (2012). Информационная составляющая современных методов управления устойчивым развитием предприятия // Вестник Адыгейского государственного университета. Серия 5: Экономика. № 2. С. 236-243.

Кузьменко И.П. Адаптивное управление как инструмент повышения устойчивости хозяйствующих субъектов/И.П. Кузьменко, В.П. Кирпанев//Вестник Адыгейского государственного университета. -Майкоп: АГУ, 2011. -Выпуск 1 (73). -С. 258-263. УДК 378


#ХАПСИРОКОВА ЖАННА СУЛТАНОВНА #Ставропольский государственный аграрный университет #llkipll[AT]mail.ru





МОЙ АРБИТР. ПОДАЧА ДОКУМЕНТОВ В АРБИТРАЖНЫЕ СУДЫ
КАРТОТЕКА АРБИТРАЖНЫХ ДЕЛ
БАНК РЕШЕНИЙ АРБИТРАЖНЫХ СУДОВ
КАЛЕНДАРЬ СУДЕБНЫХ ЗАСЕДАНИЙ

ПОИСК ПО САЙТУ