Реализация обучающей компьютерной программы на основе лингвистической базы данных автоматической системы обработки текста
Another Title
Realization of training programme on the basis of linguistic database for automatic texts processing system
Bibliographic entry
Макарич, М. В. Реализация обучающей компьютерной программы на основе лингвистической базы данных автоматической системы обработки текста = Realization of training programme on the basis of linguistic database for automatic texts processing system / М. В. Макарич // Системный анализ и прикладная информатика. - 2016. – № 1. - С. 78 - 83.
Abstract
Вследствие постоянного увеличения объема электронной текстовой информации современное общество испытывает острую потребность в автоматизированной обработке естественного языка (ЕЯ). Главное предназначение систем автоматической обработки ЕЯ – анализировать и синтезировать тексты, то есть преобразовывать тексты из их исходного вида в некоторое абстрактное представление, приближенное к представлению смысла, и обратно. Целью предлагаемой работы является разработка лингвистического и информационного обеспечения автоматической системы для обработки англоязычных публицистических текстов и ее последующая реализация в виде обучающей компьютерной программы. В статье рассматриваются примеры различных подходов к технологии создания лингвистической базы данных для систем обработки текста естественного языка. Автор дает подробное описание основных структурных блоков принципиально нового лингвистического процессора: лексико-семантического, синтаксического и семантико-синтаксического. Основным преимуществом данного процессора является использование в алфавитном словаре специальных семантических кодов в соответствии с разработанной лексико-семантической классификацией. Это позволяет автоматической системе точно определять семантические функции ключевых слов, входящих
в выделенные в процессе синтаксического анализа группы. Что, в свою очередь, помогает избежать ошибок, характерных для такого рода систем.
View/ Open
Collections
- №1[10]