Что такое данные? Типы данных. Данные


Модуль 1 (1,5 кредит): Введение в экономическую информатику

Тема 1.1: Теоретические основы экономической информатики

Тема 1.2: Технические средства обработки информации

Тема 1.3: Системное программное обеспечение

Тема 1.4: Сервисное программное обеспечение и основы алгоритмизации

Экономическая информатика и информация

1.1. Теоретические основы экономической информатики

1.1.2. Данные, информация и знания

Основные понятия данных, информации, знаний.

К базовым понятиям, которые используются в экономической информатике, относятся: данные, информация и знания. Эти понятия часто используются как синонимы, однако между этими понятиями существуют принципиальные различия.

Термин данные происходит от слова data - факт, а информация (informatio) означает разъяснение, изложение, т.е. сведения или сообщение.

Данные - это совокупность сведений, зафиксированных на определенном носителе в форме, пригодной для постоянного хранения, передачи и обработки. Преобразование и обработка данных позволяет получить информацию.

Информация - это результат преобразования и анализа данных. Отличие информации от данных состоит в том, что данные - это фиксированные сведения о событиях и явлениях, которые хранятся на определенных носителях, а информация появляется в результате обработки данных при решении конкретных задач. Например, в базах данных хранятся различные данные, а по определенному запросу система управления базой данных выдает требуемую информацию.

Существуют и другие определения информации, например, информация – это сведения об объектах и явлениях окружающей среды, их параметрах, свойствах и состоянии, которые уменьшают имеющуюся о них степень неопределенности, неполноты знаний.

Знания – это зафиксированная и проверенная практикой обработанная информация, которая использовалась и может многократно использоваться для принятия решений.

Знания – это вид информации, которая хранится в базе знаний и отображает знания специалиста в конкретной предметной области. Знания – это интеллектуальный капитал.

Формальные знания могут быть в виде документов (стандартов, нормативов), регламентирующих принятие решений или учебников, инструкций с описанием решения задач.

Неформальные знания – это знания и опыт специалистов в определенной предметной области.

Необходимо отметить, что универсальных определений этих понятий (данных, информации, знаний) нет, они трактуются по-разному.

Принятия решений осуществляются на основе полученной информации и имеющихся знаний.

Принятие решений – это выбор наилучшего в некотором смысле варианта решения из множества допустимых на основании имеющейся информации.

Взаимосвязь данных, информации и знаний в процессе принятия решений представлена на рисунке.


Рис. 1.

Для решения поставленной задачи фиксированные данные обрабатываются на основании имеющихся знаний, далее полученная информация анализируется с помощью имеющихся знаний. На основании анализа, предлагаются все допустимые решения, а в результате выбора принимается одно наилучшее в некотором смысле решение. Результаты решения пополняют знания.

В зависимости от сферы использования информация может быть различной: научной, технической, управляющей, экономической и т.д. Для экономической информатики интерес представляет экономическая информация.

В повседневной жизни мы часто встречаемся с такими понятиями как информация, информатика, информационные технологии и т.п. Этими понятиями пользуются учёные, дикторы ТВ, журналисты и политики. Однако, до настоящего времени не существует общепринятого определения понятия «информация»: многочисленные исследователи предлагают самые различные определения. Составители словарно-энциклопедических изданий фактически были вынуждены признать неразрешимость данной проблемы, и поэтому отказались от попыток дать единое определение информации. В одной словарной статье можно найти перечень сразу нескольких понятий информации.

Попытки связать информацию с привычными понятиями материя или энергия успехом не увенчались. Известно знаменитое отрицательное определение Винера: «информация есть информация, а не материя и не энергия». Из этого определения следует лишь один вывод: по своей значимости понятие информации не уступает таким основным физическим понятиям как материя или энергия.

Использование понятия «информация» в повседневной практике не вызывает у нас особых затруднений. Говоря об информации, мы обычно подразумеваем разъяснение, сообщение, изложение, какие-либо сведения, данные, объявление. В обычном, «житейском» смысле информация - это сумма сведений, которую получает некоторый субъект, человек, группа людей или животных об окружающем мире, о самом себе, о другом субъекте или изучаемом явлении. Используя эти сведения, человек может прогнозировать результаты своих действий, выбирать различные способы для достижения поставленных целей.

В СЭС приводится следующее определение информации: 1) информация – это сведения, передаваемые людьми устным, письменным или каким-либо другим способом (с помощью условных знаков, сигналов, технических средств и т.п.); 2) с середины ХХ века информация – это обмен сведениями между людьми, человеком и автоматом, автоматом и автоматом, обмен сигналами в живом и растительном мире, передача признаков от клетки к клетке, от организма к организму.

Известно ещё одно распространённое определение: информация – это сведения, уменьшающие неопределённость нашего знания об окружающем нас мире, которые являются объектом хранения, преобразования, передачи и использования.

В своей книге «Синергетика и информация» Д.С. Чернавский приводит обширную коллекцию неудовлетворительных, по его мнению, тавтологических определений информации. Большое число похожих и непохожих друг на друга определений понятия «информация» означает, что общепринятого определения информации ещё нет. Более того, отмечает Д.С. Чернавский, нет даже четкого понимания сути этого явления, хотя потребность в нем давно уже назрела.


Рассуждая об информации, Н.Н. Моисеев приходит к выводу, что являясь центральным понятием в информатике, оно до сих пор не имеет чёткого определения. Н.Н. Моисеев утверждает, что информация не является всеобщим свойством материи и считает, что необходимость понятия информации возникает лишь при изучении систем, обладающих целеполаганием.

Существует подход, в котором вводится понятие информации как отраженного разнообразия. Источником разнообразия, по мнению В.М. Глушкова, является неоднородность распределения материи и энергии в пространстве и во времени. Отсюда и определение, данное В.М. Глушковым: информация – это мера неоднородности распределения материи и энергии в пространстве и во времени, показатель изменений, которыми сопровождаются все происходящие в мире процессы.

Трудность в построении общего определения информации состоит в том, что существуют разные типы информации. Например, социальная информация, информация биологическая, информация в экономике, научная информация. В самом простом случае мы говорим об информации, которая введена в компьютер для решения задачи, или об информации, передаваемой по проводам и радиоканалам. В этом случае можно определить количество информации, указать носитель информации, память, оценить качество информации. Отметим, что здесь мы имеем дело скорее с данными, чем с информацией. В общем случае, когда мы говорим об информации при изучении окружающего мира, возникают только вопросы, на которые пока нет ответов.

Другое важное понятие информатики - данные . Этот термин встречается не менее часто, чем информация и также является основным в информатике, но не вызывает таких затруднений при определении. Есть несколько различных по форме, но эквивалентных по сути определений того, что такое «данные». Наиболее часто встречаются следующие определения:

1. Данные - это зарегистрированные сигналы.

2. Данные - это информация, представленная в виде, позволяющем запоминать, хранить, передавать или обрабатывать её с помощью технических средств.

3. Данные – это информация об объекте или отношениях объектов, выраженная в знаковой форме.

Первое определение, на наш взгляд, наиболее удачное и наиболее общее. Под сигналом здесь понимается условный знак, физический процесс, явление, несущие сообщение о каком-либо событии, состоянии объекта и режиме его работы или передающие команды управления, оповещения. Сигнал – это изменяющийся во времени физический процесс. К регистрации сигналов можно отнести: запись музыки на магнитофон, запись лекции в тетрадь, запись наблюдений в ходе эксперимента в виде чисел, графиков, фотографирование каких-либо объектов, запоминание учеником материала на уроке, нарисованный план, запись данных в память компьютера, на жёсткий диск и т.д.

Второе и третье определения понятия «данные» являются неудачными, так как в них делается попытка определить данные через информацию. Получается circulus vitiosus - порочный круг. Второе определение сужает общность понятия «данные» до уровня данных, используемых в технике. Третье определение также носит прикладной характер и имеет отношение к базам данных.

Понятия «данные» и «информация» близки, но не тождественны. Эти понятия часто смешивают и, как отмечалось выше, делаются попытки определить одно через другое. Данные и информация взаимосвязаны. Информация не может существовать без данных, без какого-либо носителя: она как-то должна быть представлена с помощью данных. Именно этот факт и пытались подчеркнуть авторы второго определения данных. С другой стороны, любые данные всегда несут в себе какую-то информацию.

Пример: мы слушаем иностранную речь по телефону, но не понимаем её. Идёт регистрация данных (запоминание сигнала), но нет процесса получения информации. Если мы запишем это сообщение на магнитофон (зарегистрируем сигнал) и передадим запись переводчику, то он сможет передать нам содержание телефонного сообщения, и мы получим информацию, которая в нём содержалась. С другой стороны, даже не понимая иностранную речь, мы можем получить информацию о том, кто нам звонил – мужчина или женщина, в каком состоянии находился звонивший человек, а в некоторых случаях мы сможем определить язык, на котором он говорил.

Определений термина «данные» в (ГОСТах) и иных по насчитано (уже) целых пять, определений «информационной технологии» - четыре. Все они в той или иной степени различаются - и непонятно, какое использовать. Сформулируем определение, применимое для всех направлений информационных технологий гармонизации ради и для достижения, как говорится, Редакция от 20.06.2018.

Государственные стандарты (ГОСТы) в информационных технологиях (ИТ). Часть II - Унификация в стандартах. Термин «данные»

Создан 08.04.2014 18:20:57

ГОСТ 1.1-2002 предлагает заняться, дабы достичь в угоду, поскольку в этом прослеживается, а все ради - для достижения, поскольку без не достичь никакой

Прислушаемся к ГОСТу, проанализируем отобранные и приведенные ниже варианты определений «данные» и оставим (или сформулируем) наиболее полное из них.

Данные (Data) по ГОСТ 15971-90

Данные (Data) по ГОСТ 34.321-96

Данные по ГОСТ Р 50922-2006

Данные по ГОСТ Р 52292-2004*

Анализ определений термина «данные» и поиск ключевых слов

Для поиска ключевых слов в определениях термина «данные» был использован первый попавшийся в поиске анализатор текстов seotxt.com/service/optimizer. Тексты сразу всех определений термина «данные» были «скормлены» анализатору, результаты его деятельности приведены в таблице ниже.

Плотность

обработки

средствами

информация

представленная

автоматическими

человека

пригодном

интерпретации

формализованном

возможном

формализованным

интерпретируемое

автоматизации

способом

представление

пригодное

информации

коммуникации

участием

передачи

представленные

обработку

передачу

позволяющие

Затем пришлось поработать руками - преобразовать исходную таблицу в новую с минимизированным числом словоформ. Словоформу «информации» приплюсовывали к «информация» и удаляли «информации». Аналогично для всех прочих, «очевидных».

После того как «очевидная» часть работы была выполнена, пришлось поработать головой над не вполне очевидной ее частью (работы, а не головы). «Понятия», «факты» и «команды» - это ведь тоже «информация»? Ведь «вручную» - это «участие человека»? Результаты правки приведены в таблице ниже.

обработки

средствами

информация

представленная

автоматическими

человека

пригодном

интерпретации

формализованном

возможном участии

передачи

С анализом покончено.

Унифицированное определение термина «данные»

Из слов, оставшихся в табличке выше, была составлена более-менее осмысленная фраза: «Информация (7), представленная (5) в формализованном (3) виде (4), пригодном (5) для обработки (5), интерпретации (3) и передачи (3) автоматическими (4) средствами (6) с возможным участием (6) человека (3)». Вот и все, унифицированное определение термина «данные» налицо.

Интересно, насколько сформулированное (не без помощи беспристрастного онлайнового анализатора) определение «коррелирует» со стандартными? В табличке ниже сведены все определения термина «данные».

Информация, представленная в формализованном виде, пригодном для обработки, интерпретации и передачи автоматическими средствами с возможным участием человека

В виде, пригодном для автоматическими средствами при возможном участии [из п. 1 табл. 1 ГОСТ 15971-90]

Представленная в формализованном виде, пригодном для передачи, интерпретации или с участием или средствами [из п. 2.7 ГОСТ 34.321-96]

Факты, или, представленные в формализованном виде и позволяющие осуществлять их передачу или как вручную, так и с помощью средств [из п. 4 прил. А ГОСТ Р 50922-2006]

По ГОСТ Р 51170-98 - удалено, поскольку полностью дублировало поз. 1

Интерпретируемое формализованным способом, пригодное для, или [ИСО/МЭК 2382-1] [из п. 4.2.1 ГОСТ Р 52292-2004]

Самым близким по духу оказалось определение данных по ГОСТ 34.321-96. Определение по ГОСТ Р 50922-2006 совсем никуда не годится, по ГОСТ 15971-90 - неполное, поскольку не учитывает возможность передачи информации, определение по ГОСТ Р 52292-2004 и вовсе какое-то «бесчеловечное»...

Сразу возник ряд предложений и вопросов.

Понятие передачи информации на текущий момент в по информационным технологиям не обнаружено. Возможно, оно и имеется, но пока такого ГОСТа в нашей базе нет. Но есть какое-никакое определение обмена данными - «Перенос данных (,) между функциональными блоками в соответствии с набором, управляющих и координацией обмена [ИСО/МЭК 2382-1] [из п. 7.2.1 ГОСТ Р 52292-2004]». Очевидно, что понятие обмена данными шире, чем понятие передачи данных, поскольку под обменом подразумевается передача данных в обе стороны. Итак,

Данные - это информация, представленная в формализованном виде, пригодном для обработки, и обмена автоматическими средствами с возможным участием человека.

Теперь о человеках. Человек - это, конечно, звучит гордо, но как-то не к месту, когда речь идет о технической тематике. В информационных технологиях все же принято оперировать понятиями, . Тогда унифицированное определение может зазвучать так:

Данные - это информация, представленная в формализованном виде, пригодном для обработки, интерпретации и обмена автоматическими средствами с возможным участием оператора .

Вопросы. Зачем в ГОСТах по информационным технологиям целых пять определений термина «данные»? Полигамия, конечно, штука интересная, но вряд ли уместна в... Но «Послушайте! Ведь, если звезды зажигают - значит - это кому-нибудь нужно? Значит - кто-то хочет, чтобы они были?»

Ответ. Во время о но, судя по всему, промышленным и предприятиям сверху спускался план по, вот они его и выполняли. В настоящее время стандарт может быть чуть ли не физическим лицом и, при соблюдении им известных и, преспокойно.

Зачем? Престижа ради: «Мы настолько крутая компания, что способны на разработку государственного или. Читайте, завидуйте!» Или для прогибания конкурентов.

В 2006, кажется, году автора волею судеб занесло в одно замечательное заведение, занимавшееся много чем, в том числе и системами электронного документооборота (СЭД). была знакома, поскольку еще в 2001 году пришлось поработать в интересах другой, конкурирующей компании, держащей (по состоянию на 2006 год) примерно 45-50 % рынка электронного документооборота как в России, так и в странах СНГ.

Оценив обстановку в заведении (и на рынке СЭД) и присвоив ей почетное звание «полнейший бардак», автор вышел на руководство с предложением разработать и ввести в действие жесточайший по своим общим техническим требованиям стандарт на системы электронного документооборота, запросив всего полгода времени и какие-то жалкие 1,5 млн. рублей в качестве компенсации. Руководство терзалось в раздумьях около месяца, но в итоге так ни на что и не решилось. А зря - у него была прекрасная возможность утереть нос конкурентам...

Примечание от 11.07.2014 г. - Вот и все! Тот самый конкурент утер нос руководству несуществующей уже компании, ищите в поисковиках «Утвержден ГОСТ Р 53898-2013 «Системы электронного документооборота. Взаимодействие систем электронного документооборота. Технические требования к электронному сообщению»». А могло бы быть все с точностью «до наоборот» еще в 2007 году...

Выводы

По определениям (по стандартов):

  • самое толковое определение данных дано в ГОСТ 34.321-96 ;
  • в ГОСТ 15971-90 никто, разумеется, внести не удосужился, а следовало бы;
  • разработчики ГОСТ Р 50922-2006 либо вообще не знали о существовании ГОСТ 34.321-96 , либо поленились стряхнуть с него пыль;
  • с ГОСТ Р 52292-2004 ситуация аналогична.

Теперь в целом: понятно, что ранее не существовало инструментария, позволяющего автоматически искать ключевые слова во множестве документов одновременно, связывать схожие разделы документов с возможностью их актуализации, но сейчас-то есть могучие AuthorIT и Framemaker - карты сами идут в руки. Только взяться и сделать - сформулировать жесткие требования к унификации терминологии и сократить количество стандартов, отменив явно лишние.

с блеском! При воспроизведении материалов портала обязательна установка активной гиперссылки на источник - страницу с этой публикацией на сайт.

Понятие «информация» достаточно широко используется в обычной жизни современного человека. Значение информации в жизни общества стремительно растет, меняются методы работы с информацией, расширяются сферы применения информационных технологий. Динамизм информатики как науки отражается и в постоянном появлении новых определений и толкований основного понятия информатики - информации.

Информация

Наиболее часто термин «информация» употребляется в его исходном значении (от латинского слова informatio) - это сведения, сообщения о каком-либо событии, деятельности и так далее. При этом в различных областях знаний могут вводиться разные определения этого понятия.

Информация в кибернетических системах - основа функционирования самоуправляемых систем (технических, биологических, социальных), и она рассматривается как обозначение содержания сигнала, полученного системой из окружающего мира в процессе взаимодействия системы с ним (Н. Винер).

Объединяющим (по крайней мере, с философской точки зрения) определением является следующее: «Информация - это отраженное разнообразие» (А. Д. Урсул). Разнообразие и отражение в развивающемся материальном мире неразрывно связаны и взаимно определяют друг друга: чем выше внутреннее разнообразие системы, тем более адекватно отражение ею внешнего мира. Чем выше возможности отражения (восприятия и понимания взаимодействия с окружающей средой), тем больше у системы возможностей адаптироваться - развиваться и увеличивать свое разнообразие (принцип необходимого разнообразия).

Данные

Остановимся на понятии «данные», которое, например, вводится следующим образом: «Мы живем в материальном мире. Все, что нас окружает, и с чем мы сталкиваемся, относится либо к физическим телам, либо к физическим полям. Все объекты находятся в состоянии непрерывного движения и изменения, которое сопровождается обменом энергией и ее переходом из одной формы в другую. Все виды энергообмена сопровождаются появлением сигналов. При взаимодействии сигналов с физическими телами в последних возникают определенные изменения свойств - это явление называется регистрацией сигналов. Такие изменения можно наблюдать, измерять или фиксировать теми или иными способами - при этом возникают и регистрируются новые сигналы, то есть образуются данные».

Это определение принимает первичность и объективность существования данных, в том числе - независимость от субъекта их использующего. Но если существование данных не зависит от того, будут ли они когда-либо использованы или нет, эффективность функционирования многих процессов (имеющих контур управления) зависит от данных. Например, данные, используемые для изменения поведения процесса на основе построения прогноза (то есть факты, характеризующие предшествующие состояния), позволят оптимизировать получение конечного результата, и будут уже выступать в роли управляющей информации . Роль и характер используемых данных в целом отражены на обобщенной схеме управляемого функционального процесса.

Система преобразования ресурса, функциональность которой обусловлена проблемным контекстом (данными, представляющими целевую задачу), фактически преобразует и информацию. Потенциально полезные данные, выделенные из общего множества в соответствии с контекстом задачи (исходная информация) в результате использования порождает выходную информацию - актуализированные данные, подтверждающие или отрицающие действенность выбранных исходных данных для решения задачи.

Знания

Переходя к рассмотрению роли понятия «информация» в человеко-машинных комплексах, используемых в когнитивных, социальных и производственных системах, необходимо более полно определить понятие «знания».

Понятие «знания» может быть определено следующим образом: «Научное знание - вся совокупность сведений, являющаяся результатом отражения материальной и нематериальной действительности в человеческом сознании» (Урсул А. Д.).

С другой стороны, утверждается, что «научно-техническая информация - это задокументированное научное знание , введенное в оборот, участвующее в функционировании и развитии общества» (Муранивский Т. В.). То есть, знание, являющееся достоянием чьего-либо сознания и не получившее «толчка» для циркулирования в обществе, не может рассматриваться как информация.

Основываясь на этом, можно констатировать условность превращения знания в информацию и информации в знание. Информация выступает как форма знания, отчужденная от его носителя (сознания субъекта), и обобществляющая его для всеобщего использования: информация - это динамическая форма существования знания, обеспечивающая его распространение и действенность (применение). Получая информацию, пользователь превращает ее путем интеллектуального усвоения (информационно-когнитивного процесса) в свои новые личностные знания, то есть происходит воссоздание знаний на основе информации.

Соответственно можно сказать, что на начальном этапе знания - это данные, актуализированные субъектом , особенностью которых является то, что они не могут быть использованы без участия самого субъекта.

Результаты решения задач (обычно, «субъективизированного»), обобщения в виде законов, теорий, совокупностей взглядов и представлений, выступающие как истинная, проверенная информация, отчужденные от субъекта их сформировавших, образуют обобществленные знания. Представленные обычно в форме документов и сообщений, они, в свою очередь, могут рассматриваться как объективно существующие данные.

Функциональное соотношение этих понятий иллюстрируется схемой, где когнитивный процесс рассматривается как неотъемлемая составляющая любого созидательного, как творческого, так и производственного процесса, предполагающего возможность прогнозирования и управления.

Станут ли данные информацией, зависит от того, известен ли метод преобразования (отражения) данных в новые или уже известные понятия. То есть, чтобы извлечь информацию из данных, необходимо иметь метод получения информации, адекватный форме представления данных. Причем необходимо учитывать тот факт, что информация не является статичным объектом - она динамична и существует только в момент взаимодействия данных и методов. Можно сказать, что все прочее время она пребывает в «потенциальном» состоянии и представлена как данные.

Кроме того, одни и те же данные могут представлять разную информацию в зависимости от степени адекватности взаимодействующих с ними методов, к которым надо отнести и условия ее извлечения (например, наличного знания субъекта).

Таким образом, в отличие от данных, которые по своей природе являются объективными (так как это результат регистрации объективно существующих сигналов, вызванных изменениями в материальных телах или полях), методы являются субъективными в том смысле, что они создаются или выбираются и далее целенаправленно применяются для решения практически значимых задач конкретного субъекта. В основе создаваемых (искусственных) методов лежат алгоритмы (упорядоченные последовательности команд), составленные и подготовленные субъектами (людьми), а в основе естественных методов лежат биологические свойства субъектов. Соответственно информация возникает и существует в момент взаимодействия объективных данных и субъективных методов.

Статьи по теме: