Большая Советская Энциклопедия (цитаты)

Тезаурус

Тезаурус (далее Т) (от греч. thesaurós — сокровище, сокровищница), множество смысловыражающих единиц некоторого языка с заданной на нем системой семантических (см. Семантика) отношений. Т фактически определяет семантику языка (национального языка, языка конкретной науки или формализованного языка для автоматизированной системы управления). Первоначально Т рассматривали как одноязычный словарь, в котором семантические отношения определяются группировкой слов по тематическим рубрикам. Например, английский Т (автор П. М. Роджет), изданный в 1962 (1-е издание 1852), содержит 1040 рубрик, по которым распределено около 240 000 слов. Указатель (ключ) к этому Т содержит алфавитный перечень слов с указанием рубрик и подрубрик, к которым относится каждое слово. Существуют традиционные общеязыковые Т (описания семантических систем отдельных языков) для английского, французского, испанского языков. К Т весьма близки одноязычные словари, задающие выражения основных семантических параметров каждого слова, например словарь русского языка С. И. Ожегова.

  В 70-х гг. 20 в. получили распространение информационно-поисковые Т В этих Т выделены специальные лексические единицы — дескрипторы, по которым можно осуществлять автоматический поиск документальной информации. С каждым словом такого Т сопоставляется синонимичный дескриптор (см. Синонимия), и для дескрипторов явным образом указываются семантические отношения: род — вид, часть — целое, цель — средство и т. д. Обычно принято разделять родо-видовые (иерархические) и ассоциативные отношения. Так, "Информационно-поисковый тезаурус по информатике", изданный в СССР в 1973, для каждого дескриптора предусматривает словарную статью, где отдельно указаны синонимичные ключевые слова, родовые, видовые и ассоциативные дескрипторы. Для лучшей ориентации в ассоциативных связях между дескрипторами к этому Т приложены семантические карты тематических классов. При автоматизированном информационном поиске ищутся документы, у которых индекс содержит не только дескрипторы запроса, но и те дескрипторы, которые находятся с ними в определенных семантических отношениях. Иногда бывает полезно выделять в Т конкретные ассоциативные отношения, специфичные для данной тематической области: болезнь — возбудитель, прибор — назначение (или измеряемая величина) и т. п. Положение лексической единицы (слова, словосочетания) в Т характеризует его смысл в языке; знание системы семантических отношений, в которые вступает данное слово (в том числе и рубрик, куда оно входит), позволяет судить о смысле этого слова.

  В широком смысле Т интерпретируют как описание системы знаний о действительности, которыми располагает индивидуальный носитель информации или группа носителей. Этот носитель может выполнять функции приемника дополнительной информации, вследствие чего изменяется и его Т Исходный Т определяет при этом возможности приемника при получении им семантической информации. В психологии и при изучении систем с искусственным интеллектом рассматривают свойства Т индивидуумов, проявляющиеся при восприятии и понимании информации. В социологии и теории коммуникаций изучают свойства Т индивидуумов и коллективов, обеспечивающие возможность взаимопонимания на основе общности Т В этих ситуациях в Т приходится включать сложные высказывания и их семантические связи, определяющие запас сведении, которыми располагает сложная система. Т фактически содержит не только информацию о действительности, но и метаинформацию (сведения об информации), обеспечивающую возможность приема новых сообщений.

  Лит.: Черный А. И., Общая методика построения тезаурусов, "Научно-техническая информация. Сер. 2", 1968, №5; Варга Д., Методика подготовки информационных тезаурусов, пер. (с венг.), М., 1970; Шрейдер Ю. А., Ты в информатике и теоретической семантике, "Научно-техническая информация. Сер. 2", 1971, № З.

  Ю. А. Шрейдер.


Для поиска, наберите искомое слово (или его часть) в поле поиска


Новости 29.03.2024 08:23:50