Информатика и ИТ. Нейросети.. Николай Петрович Морозов
в его тезаурус. Пополнение тезауруса получателя вновь выявленными сведениями и является результатом восприятия информации.
Для понимания полученной информации получатель (называемый также пользователем) должен изначально обладать определенным запасом знаний о некоторой предметной области.
Количество семантической информации, извлекаемой пользователем из поступающих сообщений, зависит от степени подготовленности его тезауруса для восприятия такой информации. Полное незнание предмета не позволяет извлечь полезную информацию из принятого сообщения об этом предмете. По мере роста знаний пользователя о предмете растет количество полезной информации, извлекаемой из сообщения.
В зависимости от соотношений между смысловым содержанием информации S и тезаурусом пользователя Sp изменяется количество семантической информации Ic, воспринимаемой пользователем и включаемой им в свой тезаурус. Характер такой зависимости показан на рис.1.1. Этот рисунок демонстрирует следующее:
– при Sp = 0 пользователь не имеет знаний о предметной области, поэтому не понимает поступившее сообщение S и количество полученной им семантической информации равно нулю (Ic = 0);
– если тезаурус пользователя Sp, т.е. он уже «все знает» о предметной области, то очередное сообщение не содержит для него ничего нового, и Ic = 0;
– вначале по мере роста объема тезауруса Sp возрастает количество информации, понимаемой пользователем, и, следовательно, растет количество извлекаемой полезной информации Ic, пополняющей тезаурус пользователя;
– максимальное количество семантической информации пользователя получает тогда, когда объем тезауруса Sp позволяет ему понимать всю поступающую информацию (это значение Sp обозначено как Sp opt);
– при дальнейшем увеличении Sp количество понятой информации уже не увеличивается, но все больше информации из поступающего сообщения оказывается пользователю известной; поэтому количество Ic начинает уменьшаться.
Рис. 1.1. Зависимость Ic (количества семантической информации,
воспринимаемой пользователем) от его тезауруса Sp.
Из вышесказанного следует, что количество новых знаний, получаемых пользователем информации, является величиной относительной. Одно и то же сообщение может иметь определенный смысл для компетентного пользователя и быть бессмысленным для пользователя некомпетентного.
Так, например, источником информации может быть китайский врач, написавший книгу (данные) об особенностях китайской медицины. Открыть эту книгу может каждый, прочесть – только тот, кто умеет читать по-китайски. Такой читатель сумеет воспринять текст, составленный автором. Но, чтобы понять и воспринять этот текст необходимо иметь знания по медицине вообще, и китайской медицине в частности. Эти знания отсутствуют в исходном тексте, но автор, когда писал свой текст, имел их в виду,