Учебное пособие для студентов факультета вмик мгу


Der — синтаксический дериват: слово, совпадающее с С0 по смыслу, но принадлежащее к другой части речи; Der (искать) = поиск. Gener



Pdf просмотр
страница4/4
Дата14.02.2017
Размер0.69 Mb.
Просмотров408
Скачиваний0
1   2   3   4
Der синтаксический дериват: слово, совпадающее с С
0
по смыслу, но принадлежащее к другой части речи;
Der
(искать) = поиск.
Gener — название понятия, родового по отношению к понятию, обозначенному С
0
;
Gener
(клубника) = ягода.
Attr — «атрибут»;
Attr
(актер) = сцена.
Cous «делать так, чтобы»;
Cous
(школа) = открывать.
Примеры семантических представлений:

Практические аспекты создания лингвистических процессоров. Учебное пособие.
33 1. Костя обещает Юре, что Боря придет.
Костя зависеть
Рема
1
Тема
1
заинтересован
Юра знать каузировать однократно эксплицитно раньше одновременно момент речи приходить однократно
Боря
Тема
2
Рема
2 2. Иван читает только журналы. читать
Иван
Журналы
И
читать быть неверно неверно существовать быть
Рема
Тема
4.3. Падежные системы
Среди АОТ-систем, имеющих семантический компонент выделяются так называемые падежные системы, в которых семантика предложения описывается как система семантических валентностей, через связи главного слова с его семантическими актантами, т.е. через семантические отношения или семантические падежи. Например,

Волкова И.А. Введение в компьютерную лингвистику.
34 глагол «дать» требует семантических падежей дающего (агенса), адресата и объекта
передачи.
Слабым местом падежных систем является то, что в них, как правило, отсутствуют четкие определения и критерия выделения падежей, неясна степень полноты их набора и границы между «падежными» и другими элементами предложения.
4.4. Звук и смысл
Вообще говоря, чтобы правильно использовать слова в разных ситуациях, недостаточно знать значения слов, их словарные толкования. Так, например, обозначающие одни и те же понятия слова «отец» и «папа», «бабушка» и «старуха» в разных ситуациях далеко не взаимозаменимы. Понятийное ядро слов как бы окружено ореолами созначений. Ближайший к ядру ореол — качественно-признаковое
значение слова. Это тот аспект значения, который можно описать путем перечисления качественных признаков данного понятия. Например, понятийное ядро слова
«птица» — покрытое пухом и перьями животное из класса позвоночных с крыльями, двумя ногами и клювом, а качественно-признаковое значение — что-то быстрое, стремительное. У других понятий на первое место могут выдвигаться другие признаки, например, «слон» — большой и сильный, «любовь» — хорошее, светлое, возвышенное.
Зная качественно-признаковое значение слов, можно понять, например, фразу «Он
птицей полетел на свидание» или «Что за прелесть!», которая может относиться и к девушке, и к платью, и к закату, и к цветку…
Кроме того, и звуковая форма слов содержательна, информативна, служит одним из аспектов значения. Звуковая содержательность чаще всего поддерживает, подчеркивает понятийный и качественно-признаковый аспекты значения. Соответствие значения и звучания делает слово выразительнее, живее, «нагляднее». Ореол содержательности звучания, или фоносемантический ореол, есть у любого слова, только чаще всего мы его не замечаем.
Вообще говоря, в языке информативно, пропитано значением все — звучание речи, отдельные слова и их сочетания, способы соединения слов, устройство предложений, композиция текстов — все от мельчайших звуков до сложной архитектуры всего здания языка.
Оказалось, что самые тонкие и трудно уловимые ореолы значения поддаются числовому измерению, а значит, компьютерной обработке.
Около 40 лет назад группа американских исследователей под руководством Ч. Осгуда опубликовала сенсационную книгу под заглавием «Измерение значения». Осгуд доказал, что в области семантики возможны измерения, и показал, как их можно выполнить. С помощью методики Осгуда оказалось возможным измерить качественный аспект (ореол) значения. Свой измерительный инструмент Осгуд назвал
«семантический дифференциал» — это некоторая шкала, например «хорошее — плохое»:
Фоносемантический ореол
Качественно признаковый ореол
Понятийное ядро

Практические аспекты создания лингвистических процессоров. Учебное пособие.
35 1
– очень хорошее
2
– хорошее
3
– никакое
4
– плохое
5
– очень плохое.
Шкала предлагается носителям языка — информантам (не менее 50-60 человек), которым предъявляются слова, и они должны поставить словам оценки. По ответам информантов вычисляется средняя оценка слова по данной шкале. Например, оценка слова «дом» по шкале «хорошее — плохое» — 2.2.
Чтобы получить полное описание качественно-признаковой ореольной семантики языка, надо брать шкалы из всех прилагательных и мерить по ним все остальные слова языка. Это огромная работа. К счастью, оказалось, что есть всего три основные шкалы, три фактора, вокруг которых группируются все остальные (т.е. по ним получаются почти такие же значения). Это
1. Фактор оценки (хорошее плохое, полезное — вредное, светлое — темное, красивое — безобразное…),
2. Фактор силы (сильное — слабое, легкое — тяжелое, большое — маленькое…),
3. Фактор активности (подвижное — статичное, быстрое — медленное, активное — пассивное…).
А в русском языке выделяется еще один фактор:
4. Фактор родокомфортности (нежное — грубое, мягкое — твердое, женственное — мужественное, удобное — неудобное…).
Т.е. получается, что качественно-признаковому ореолу каждого слова соответствует точка в трехмерном (четырехмерном) кубе, и координаты точки можно измерить. Но работа по составлению такого куба достаточно трудоемка и сопряжена с рядом сложностей.
Выяснился поразительный факт, что «семантическим дифференциалом» можно
«измерить» и звуки речи. Исследованием проблемы соотношения звука и смысла в
России занимается группа ученых под руководством профессора А.П. Журавлева [14].
При «измерении» звуков информанты ставили им оценки по тем же признаковым шкалам, которые объединились в те же группы (факторы). В результате выявились непреложные закономерности: О — светлый, Ы — темный, Р — устрашающий, И — безопасный, К — быстрый, Ш — медленный… После измерения всех звуков по четырем шкалам и размещения их в семантическом кубе получилось русское фонетико- семантическое пространство. Имея его компьютер моментально вычисляет фоносемантический ореол любого слова (учитывая частоту встречаемости каждого звука в речи, ударение и первую букву слова).
Конечно же, нет прямой связи между понятиями о предметах, предметами и их названиями. А вот качественный и фоносемантический ореолы, как правило, совпадают. Т.е. у большинства слов значение и звучание находятся во взаимном соответствии, и опыт показывает, что дисгармония аспектов значения затрудняет функционирование слов в речи.
Вот несколько наиболее ярких примеров вычисления фоносемантического ореола слов:
БОГАТЫРЬ — большое, мужественное, сильное, громкое, могучее.
ИДЕАЛ — хорошее, светлое, красивое, яркое, доброе.
ЛАСКА — хорошее, гладкое.
ШУШЕРА — плохое, темное, отталкивающее, низменное, тусклое.

Волкова И.А. Введение в компьютерную лингвистику.
36
А вот интересное соотношение фоносемантических оценок близких по смыслу слов по некоторым показательным шкалам: ракета лайнер самолет аэроплан
2.0 2.2 3.1 3.3 3.5 быстрое медленное лик лицо морда рожа рыло харя
2.1 2.5 2.7 3.0 3.1 3.4 3.5 красивое отталкивающее

Практические аспекты создания лингвистических процессоров. Учебное пособие.
37 5. Прагматический компонент ЕЯ- систем
Прагматика — наука, изучающая язык в его отношении к тем, кто его использует, функционирование языковых знаков в речи.
Пропозиция — факт, передаваемый предложением; смысловое содержание предложения; семантический инвариант, общий для всех членов модальной и коммуникативной парадигм предложения и производных от предложения конструкций.
Пропозиция является пресуппозицией в прагматическом смысле, если говорящий считает ее истинность само собой разумеющейся и исходит из того, что другие участники контекста считают также.
Набор пресуппозиций человека определяется на основании тех утверждений, которые он делает, вопросов, которые он задает. Пресуппозиции — это пропозиции, неявно подразумеваемые еще до начала передачи речевой информации. Пресуппозиции, естественно, не обязаны быть истинными. В нормальной ситуации человек, по меньшей мере, убежден в истинности своих пресуппозиций. Именно поэтому мы часто извлекаем из высказываний данного лица больше информации о его убеждениях, чем он нам сообщает. Иногда, однако, в пресуппозиции может быть пропозиция, в истинности которой мы сомневаемся, или даже про которую считаем или знаем, что она ложна. Это происходит в ситуации обмана.
Модальность — отношение значения предложения к действительности.
Вербализация — речевое выражение чего-либо.
Анафора (anaphora (греч.)) — повторение.
Анафорический — отсылочный.
Номинация (лат. nominatio — наименование) — образование языковых единиц, характеризующихся номинативной функцией, т.е. служащих для названия и вычленения фрагментов действительности и формирования соответствующих понятий о них в форме слов, сочетаний слов, фразеологизмов и предложений.
Номинат — представление говорящего о фрагменте ситуации, для которой производится вербализация.
5.1. Предмет изучения прагматического компонента
Перед прагматическим компонентом встает два рода проблем:
— определение типов речевых актов, «продуктов» речи и
— описание признаков и свойств речевого контекста, влияющих на определение того, какая именно пропозиция выражается данным предложением.
Различаются следующие основные типы речевых актов:
— утверждение,
— приказ,
— контрфактическое высказывание,

Волкова И.А. Введение в компьютерную лингвистику.
38
— требование,
— догадка,
— опровержение,
— просьба,
— возражение,
— предсказание,
— обещание,
— призыв,
— рассуждение,
— объяснение,
— оскорбление,
— вывод,
— умозаключение,
— предположение,
— обобщение,
— ответ,
— обман.
Задача определения типа речевого акта считается задачей, не представляющей особых трудностей, если известен контекст высказывания, влияющий на ту функцию, которую говорящий придает определенной пропозиции, а также на саму пропозицию. Очевидно, что семантические правила определения пропозиции, выражаемой данным предложением, могут быть сформулированы лишь с учетом некоторых признаков той ситуации, в которой это предложение произносится. В качестве примеров можно проанализировать следующие предложения:
«Все хорошо проводят время».
«Мы победим».
«Это великолепная картина».
«Ты можешь передать мне солонку?».
Задача определения типа речевого акта в итоге сводится к заданию необходимых и достаточных условий успешного выполнения целей самого речевого акта, а не определению условий истинности, заключенной в нем пропозиции.
Задача описания признаков и свойств речевого контекста сводится к изучению того, каким образом речевой контекст влияет на пропозицию, выражаемую предложением в этом контексте.
В целом лингвистическая прагматика не имеет четких контуров, в нее включается комплекс вопросов, связанных с говорящим субъектом, адресатом, их взаимодействием в коммуникации, ситуацией общения.
В связи с субъектом речи изучаются:
1) явные и скрытые цели высказывания,
2) речевая тактика и типы речевого поведения,
3) правила разговора, подчиненные так называемому принципу сотрудничества, рекомендующему строить речевое общение в соответствии с принятой целью и направлением разговора, например: а) адекватно нормировать сообщаемую информацию, б) сообщать только истинную информацию и обоснованные оценки, в) делать сообщения релевантными относительно темы разговора,

Практические аспекты создания лингвистических процессоров. Учебное пособие.
39 г) делать речь ясной, недвусмысленной и последовательной,
4) установка говорящего или прагматическое значение высказывания: косвенные смыслы высказывания, намеки, иносказание, обиняки и т.п.,
5) референция говорящего, т.е. отнесение языковых выражений к предметам действительности, вытекающие из намерения говорящего,
6) прагматические пресуппозиции: оценка говорящим общего фонда знаний, конкретной информированности, интересов, мнений и взглядов, психологического состояния, особенностей характера и способности понимания адресата,
7) отношение говорящего к тому, что он сообщает: а) оценка содержания высказывания
(его истинность, ирония, многозначительность, несерьезность и пр.), б) введение в фокус интереса одного из тех лиц, о которых говорящий ведет речь (или эмпатия), в) организация высказывания в соответствии с тем, чему в сообщении придается наибольшее значение.
В связи с адресатом речи изучаются:
1) интерпретация речи, в том числе правила вывода косвенных и скрытых смыслов из прямого значения высказывания,
2) воздействие высказывания на адресата: расширение информированности адресата, изменения в его эмоциональном состоянии, взглядах и оценках, влияния на совершаемые адресатом действия, эстетический эффект и т.п.,
3) типы речевого реагирования на высказывание (например, способы уклонения от прямого ответа на вопрос).
В связи с отношениями между участниками коммуникации изучаются:
1) формы речевого общения (информативный диалог, дружеская беседа, спор, ссора и т.п.),
2) социально-этикетная сторона речи (формы обращения, стиль общения),
3) соотношение между участниками коммуникации в тех или иных речевых актах
(сравните просьбу и приказ).
В связи с ситуацией общения изучаются:
1) интерпретация таких слов, как «здесь», «сейчас», «этот» и т.п.
2) влияние речевой ситуации на тематику и формы коммуникации (типичные темы и формы разговоров, например, в гостях, в больницах, в приемных адвокатов и т.п.).
Изучение прагматических свойств языка имеет обширные области пересечения с изучением свойств связного текста.
5.2. Анализ связного текста (дискурса)
Текст — комплекс взаимосвязанных друг с другом предложений, который обладает определенной автономностью от прочих аналогичных комплексов и определенной смысловой целостностью, единством, обусловливаемым единством коммуникативного намерения автора текста.
Целостность текста превращает его в систему, в которой элементы зависят друг от друга и предполагают друг друга, что проявляется в двух типах явлений: в пронизывающих и скрепляющих текст повторениях некоторых смысловых единиц и в опущении отдельных фрагментов текста, которые в изолированном предложении были бы необходимы, а в целом тексте могут быть восполнены из других предложений.

Волкова И.А. Введение в компьютерную лингвистику.
40
Наиболее часто разработчики автоматизированных систем сталкиваются с явлениями
анафорического (отсылочного, анафора — повтор) замещения значащих выражений местоимениями и эллипсиса (опущения структурно необходимых частей предложения, когда они аналогичны каким-то частям данного или соседнего предложений). Но это лишь часть широкого круга явлений сверхфразового уровня. Так, проблема анализа анафорических связей местоимений — частный случай проблемы выявления анафорических отношений в тексте и связанных с ней проблем референции — установления соответствия между языковыми выражениями (прежде всего именными группами) и внеязыковыми сущностями, и кореференции — определения языковых выражений, эквивалентных с точки зрения референции.
Дескрипция — именная группа, в вершине которой стоит нарицательное существительное.
Полная дескрипция — наиболее простой способ осуществления однозначной референции к некоторому объекту. Например, «Будьте ровно в восемь часов около
канавы, в которую вчера упала с головы вашей шляпа».
Неполным дескрипциям заведомо удовлетворяют более одного объекта. В случае референции с помощью неполных дескрипций или с помощью неоднозначной анафорической номинации говорят, что имеет место референциальный конфликт.
Например, «Рассмотрим структуру памяти ЭВМ, которая состоит их двух основных
частей».
Одной из основных моделей обработки дискурса, на которой основываются современные системы обработки связного текста, является модель Т.А. ван Дейка и
В. Кинча [15, 16]. Основные положения этой модели следующие.
Сутью процессов обработки дискурса является конструирование в памяти человека ментального представления текста. В этих процессах используются как воспринимаемая информация, так и информация, содержащаяся в памяти человека.
Люди способны сконструировать ментальное представление текста, описывающего объекты, события, при условии, что они имеют более общие знания о таких объектах и событиях.
Существуют различные типы связного текста. Каждый тип текста имеет свои языковые и когнитивные (познавательные) различия. Существуют различные типы, стили и способы понимания (например, быстрый просмотр газеты, чтение учебника). Разные пользователи языка могут обладать различными знаниями и умениями, что влияет на понимание дискурса. В разных ситуациях пользователи языка по-разному понимают разные тексты.
Важной особенностью понимания связных текстов является способность человека предугадывать их содержание. У понимающего текст возникают ожидания того, что будет сказано, прежде чем он реально это услышит или прочитает, и это может облегчить процесс понимания.
Один из принципиальных моментов модели ван Дейка и Кинча — выделение и обособление текстовых баз и ситуационных моделей. С одной стороны, в процессе понимания текста строится его текстовая база, которая включает семантическое представление воспринимаемого текста, и в виде взаимосвязанных пропозиций фиксирует то, о чем было сказано в тексте. Текстовая база фиксирует и особенности формы выражения пропозиций на ЕЯ.
С другой стороны, понимание текста предполагает активацию, обновление и другие формы функционирования так называемой ситуационной модели: это когнитивное представление событий, действий, лиц и вообще ситуаций, о которых говорится в тексте. Текстовая база сопоставляется с тем, что есть в ситуационной модели, а

Практические аспекты создания лингвистических процессоров. Учебное пособие.
41 ситуационная модель может модифицироваться в соответствии с содержанием текстовой базы.
Отметим, что формируемая в процессе понимания текстовая база должна удовлетворять критерию локальной связности, предполагающему, что пропозиции, встречающиеся в тексте должны быть связаны между собой, а также критерию
глобальной связности. В процессе понимания дискурса человек пытается понять не только локальную информацию, но и текст в целом, выявить его суть, содержание, тему. Глобальная связность предполагает, что в процессе понимания выявляется основная тема текста и определяется роль каждой фразы с точки зрения раскрытия основной темы.
Еще одним важным фактором, влияющим на процессы понимания дискурса, является учет схематической структуры текста. Во многих типах дискурса проявляется традиционная, культурно-обусловленная схематическая структура, организующая глобальное содержание текста. Например, рассказы, как правило, строятся по иерархической схеме Завязка – Кульминация – Развязка. Свою структуру имеют доказательства чего-либо, описания сложных технических систем и прочее.

Волкова И.А. Введение в компьютерную лингвистику.
42
ЛИТЕРАТУРА
[1]. Зализняк А.А. Грамматический словарь русского языка. — М.: Русские словари,
2003.
[2]. Волкова И.А. Адаптация и обучение системы общения с ЭВМ на естественном языке. Канд. диссертация. М. 1982.
— http://axofiber.org.ru/download/volkova- dissertation.pdf
[3]. Попов Э.В. Обыщение с ЭВМ на естественном языке. — М.: Наука, 1982.
[4]. Искусственный интеллект. Книга 1. Справочник. — М.: Радио и связь, 1990.
[5]. Мальковский М.Г. Диалог с системой искусственного интеллекта. — М.: Изд-во
МГУ, 1985.
[6]. Апресян Ю.Д. Идеи и методы современной структурной лингвистики. — М.:
Просвещение, 1966.
[7]. Гладкий
А.В.
Синтаксические структуры естественного языка в автоматизированных системах общения. — М.: Наука, 1985.
[8]. Шенк З. Обработка концептуальной информации. — М.: Энергия, 1980.
[9]. Лингвистический энциклопедический словарь. — М.: Советская энциклопедия,
1990.
[10]. Волкова И.А., Руденко Т.В. Формальные грамматики и языки. Элементы теории трансляции. — М.: Изд-во МГУ, 1999.
[11]. Ахо А., Сети Р., Ульман Дж. Компиляторы — М.: С-П, Киев, Вильямс, 2001.
[12]. Волкова И.А., Головин И.Г. Синтаксический анализ фраз естественного языка на основе сетевой грамматики. ДИАЛОГ'98, Труды межд. семинара. — М.: 1998.
[13]. Мельчук И.А. Опыт теории лингвистических моделей «СМЫСЛ
↔ ТЕКСТ». —
М.: Наука, 1974.
[14]. Журавлев А.П. Звук и смысл. — М.: Просвещение, 1991.
[15]. Ван Дейк Т.А., Кинч В. Стратегия понимания связного текста.// Новое в зарубежной лингвистике. Вып. XXIII — М.: Прогресс, 1988, с. 153-211.
[16]. Ван Дейк Т.А. Язык. Познание. Коммуникация. — М.: 1989.

Каталог: download
download -> Составление простейшей программы в среде lego education. Запуск модели «Обезьянка барабанщица», «Рычащий лев», «Автомобиль»
download -> Функциональные части компьютера, история развития, базовая конфигурация
download -> Компьютер: друг или враг?
download -> Лекция №2 «Теоретические основы игры дошкольника» Зарубежные и отечественные теории игры
download -> Доклад муниципальное образовательное
download -> Литература для воспитанников стр. Приложения стр
download -> Министерство здравоохранения Республики Беларусь
download -> Игра как средство активизации познавательной активности учащихся в ходе изучения темы Алгоритмизация и программирование


Поделитесь с Вашими друзьями:
1   2   3   4


База данных защищена авторским правом ©nethash.ru 2019
обратиться к администрации

войти | регистрация
    Главная страница


загрузить материал