Глоссариум по цифровой экономике. 1500 терминов и определений. Александр Юрьевич Чесалов
(Data) Для социальных наук данные обычно представляют собой числовые файлы, полученные из методологий социальных исследований или административных записей, из которых производится статистика99.
Данные ограниченного использования (Restricted-use data) – это данные, которые содержат конфиденциальную информацию (обычно о людях), которая может позволить идентифицировать людей. Наличие конфиденциальной информации в депонированном цифровом контенте представляет собой проблему управления для долгосрочного хранения, чтобы гарантировать, что требования к архивному хранилищу для достижения распределенной избыточности учитывают, например, требования конфиденциальности100.
Данные тестирования (Testing Data) – подмножество доступных данных, выбранных специалистом по данным для этапа тестирования разработки модели.
Двоичное число (Binary number) – это число, записанное в двоичной системе счисления, в которой используются только нули и единицы. Пример: Десятичное число 7 в двоичной системе счисления: 111101.
Двоичный формат (Binary format) – это любой формат файла, в котором информация закодирована в каком-либо формате, отличном от стандартной схемы кодирования символов. Файл, записанный в двоичном формате, содержит информацию, которая не отображается в виде символов. Программное обеспечение, способное понимать конкретный метод кодирования информации в двоичном формате, должно использоваться для интерпретации информации в файле в двоичном формате. Двоичные форматы часто используются для хранения большего количества информации в меньшем объеме, чем это возможно в файле символьного формата. Их также можно быстрее искать и анализировать с помощью соответствующего программного обеспечения. Файл, записанный в двоичном формате, может хранить число «7» как двоичное число (а не как символ) всего в 3 битах (т. е. 111), но чаще используется 4 бита (т. е. 0111). Однако двоичные форматы обычно не переносимы. Файлы программного обеспечения записываются в двоичном формате. Примеры файлов с числовыми данными, распространяемых в двоичном формате, включают двоичные версии IBM файлов Центра исследований цен на ценные бумаги и Национального банка торговых данных Министерства торговли США на компакт-диске. Международный валютный фонд распространяет международную финансовую статистику в смешанном формате и двоичном (упаковано-десятичном) формате. SAS и SPSS хранят свои системные файлы в двоичном формате102.
Дезинтермедиация (Disintermediation) – это устранение посредников между производителями и потребителями103.
Действительный (xml) (Valid) – это XML-документ, правильность которого проверена на соответствие DTD или схеме. Процесс проверки подлинности документа называется валидацией. Обратите внимание, что это более строго, чем просто проверка правильности оформления документа104.
Декомпрессия (Decompression) – это функция, которая используется для восстановления данных в несжатую форму после сжатия
99
Data [Электронный ресурс] www.umich.edu (дата обращения: 07.07.2022) URL: https://www.icpsr.umich.edu/web/ICPSR/cms/2042#D
100
Restricted-use data [Электронный ресурс] www.umich.edu (дата обращения: 07.07.2022) URL: https://www.icpsr.umich.edu/web/ICPSR/cms/2042#R
101
Binary number [Электронный ресурс] www.umich.edu (дата обращения: 07.07.2022) URL: https://www.icpsr.umich.edu/web/ICPSR/cms/2042#B
102
Binary format [Электронный ресурс] www.umich.edu (дата обращения: 07.07.2022) URL: https://www.icpsr.umich.edu/web/ICPSR/cms/2042#B
103
Disintermediation [Электронный ресурс] www.igi-global.com (дата обращения: 07.07.2022) URL: https://www.igi-global.com/dictionary/user-generated-content-and-its-influence-on-tourists-choices/7933
104
Valid (xml) [Электронный ресурс] www.umich.edu (дата обращения: 07.07.2022) URL: https://www.icpsr.umich.edu/web/ICPSR/cms/2042#V