Слайд 1Единицы информации
Классификация и основные свойства единиц информации
Слайд 2Понятие информации
Информация – совокупность документированных данных, хранящихся на электронных или бумажных
носителях, относящаяся к выбранной предметной области
Данные – это знаковые совокупности на носители, используемые для передачи или хранения информации, расположенные в соответствии с некоторой структурой.
Слайд 3Структура сообщения
Синтаксис (формат) сообщения – совокупность правил, которым должны соответствовать структура
информационных сообщений, передаваемых в виде совокупности знаков для того, чтобы приемник мог воспринять ее и обработать;
Семантика сообщения – содержание, которое изменяет знания приемника данных.
Слайд 4Форматы данных
Принято различать следующие форматы:
Фиксированный (жесткий) формат данных – выделяются единицы
информации, причем для каждой из единиц устанавливается имя и область допустимых значений;
Свободный формат данных – способ форматирования документов, при котором не выделяются специфические единицы данных.
Слайд 5Основные единицы информации
Атрибуты (реквизиты)
Составные единицы информации (СЕИ)
Слайд 6Атрибуты
Атрибут (реквизит) – информационное отображение отдельного свойства некоторого объекта, процесса или
явления
Слайд 7Атрибуты
Атрибут характеризуется именем и значением.
Имя атрибута – условное обозначение в процессе
обработки данных.
Значение атрибута – величина, характеризующая свойство объекта в конкретных обстоятельствах.
Все допустимые значения атрибута образуют множество, называемое доменом данного атрибута.
Слайд 8Атрибуты
Атрибут с именем X представляет собой пару (X, z), где z
– элемент множества Z (домена значений).
Определение атрибута в информационной системе предполагает указание его имени и списка значений.
Слайд 9Атрибуты
В языке C/C++ объявление переменных включает в себя описание типа и
задание имени переменных:
int a;
float fahr;
char name[ ];
присвоение значения может быть выполнено при объявлении переменной:
float price=3.12;
или в процессе работы программного модуля.
Слайд 10Атрибуты
Для некоторых доменов множество входящих в них значений задается с помощью
перечисления допустимых значений.
Если в домене есть необходимость перечислить обозначения объектов из некоторого класса, то разрабатывается классификатор, содержащий условные обозначения (коды) отдельных объектов и классов, к которым эти объекты отнесены.
Слайд 11Атрибуты
Если значения атрибутов определены на одном и том же домене, то
такие атрибуты называются ролевыми.
Пример: на домене FAMILY определены атрибуты: СТУДЕНТ, ПРЕПОДАВАТЕЛЬ
Домен значений может не храниться как самостоятельный информационный объект, однако среди ролевых атрибутов в базе данных существует атрибут с наиболее полным значением. Данный атрибут можно использовать для контроля вводимой информации.
Слайд 12Составные единицы информации
Составной единицей информации (СЕИ) называется набор из атрибутов и
других СЕИ.
Определение СЕИ построено рекурсивно, из элементарных единиц строятся более сложные. База данных также может быть рассмотрена как составная единица информации
Слайд 13Составные единицы информации
Множество атрибутов объединяются в одну СЕИ по следующим принципам:
соответствующие
атрибуты описывают один и тот же процесс;
значения атрибутов, входящих в СЕИ, возникают одновременно, связаны логическими или арифметическими соотношениями
Слайд 14Составные единицы информации
Характеристики СЕИ являются:
Имя – условное обозначение в процессах обработки
информации
Структура – вхождение одних единиц информации в состав других единиц информации
Значения – набор значений атрибутов и СЕИ, входящих в состав рассматриваемой единицы информации
Слайд 15Составные единицы информации
Одна из задач СЕИ в информационных системах – описание
структуры экономических документов
Документ – материальный носитель информации, содержащий оформленные в установленном порядке сообщения и имеющий юридическую силу.
Слайд 16Составные единицы информации
Описание структуры СЕИ
Для описания структуры независимо от языка программирования
используется обозначение:
ИМЯ СЕИ(ИМЯ АТРИБУТА, …)
Слайд 17Составные единицы информации
Определение структуры в C/C++
struct Event {
int hour, min;
char theme[100],
name[50];
int num;
};
Данное определение – это определение типа. Можно описать переменные данного типа (данной структуры):
Event e1, e2[5];
Элементы структуры называются полями.
Поля могут быть любого основного типа, массивами, указателем, объединением или структурой. Для обращения к полю используется операция выбора («точка» для переменной и -> для указателя):
e1.hour=12; e1.min=30;
strncpy(e2[0].theme, “Подготовка к следующему семинару”, 99);
Слайд 18Составные единицы информации
Определение значения СЕИ можно дать на основе значений единиц,
входящих в состав СЕИ.
Значения СЕИ, входящих в другую СЕИ, определяется рекурсивно, однако необходимо учитывать размерность СЕИ.
Одно значение СЕИ при хранении в памяти ЭВМ называется записью.
Слайд 19Операции над единицами информации
Переименование единицы информации – операция присвоения нового имени,
объявление синонима – это установление второго, третьего и т.д. равноценного имени
Операция над значением атрибута – это перекодирование, т.е. замена существующего кода значения на новый для всех значений
Выборка – операция выделения подмножества значений СЕИ, удовлетворяющих заранее поставленным условиям
Слайд 20Операции над единицами информации
Корректировка – выполнение одной из операций:
добавление нового значения
СЕИ
исключение существующего значения СЕИ
замена некоторого значения СЕИ на новое значение
Декомпозиция – операция преобразования исходной СЕИ в несколько СЕИ с различными структурами
Композиция – операция преобразования нескольких СЕИ с различными структурами в одну
Нормализация – операция перехода СЕИ с произвольной структурой к СЕИ с двухуровневой структурой
Свертка – операция преобразования СЕИ с двухуровневой структурой в СЕИ с произвольной многоуровневой структурой
Слайд 21Экономические показатели
При анализе экономических документов ставится задача разделения документа на элементарные
осмысленные фрагменты – показатели
Показатель представляет собой полное описание количественного параметра, характеризующего некоторый объект или процесс
Как единица информации показатель является разновидностью СЕИ. Схематично структура показателя представляется выражением:
П(P1,P2,…,Pk,Q)
P1,…,Pk – атрибуты-призанки, Q – атрибут-основание
Слайд 22Показатели
Реквизит-признак представляет собой информационное отображение качественного свойства некоторого объекта
Реквизит-основание является отображением
количественного свойство объекта или процесса.
При хранении экономических показателей один файл (таблица) отводится под группу показателей с одинаковым составом реквизитов признаков.
Слайд 23Минимальный набор атрибутов показателя
Атрибуты, отражающие идентификаторы объекта
Атрибуты, отражающие признак времени
Атрибуты, отображающие
некоторое количественное свойство объекта
Причина выделения показателей заключается в том, что показатель является минимальной группой атрибутов, сохраняющей информативность и достаточной для образования самостоятельного документа.
Слайд 24Пример
Рассмотрим документ «Приходный ордер». В его состав входят следующие реквизиты:
Дата
Склад
Пост –
код поставщика
Кмат – код материала
Кол-во – количество по документу
Цена
Сумма
Реквизиты основания: Кол-во, Цена, Сумма, на основе этих реквизитов можно построить три показателя.
П1(Кмат, Склад, Пост, Дата, Кол-во)
П2(Кмат, Цена)
П3(Кмат, Склад, Пост, Дата, Сумма)
Причем Сумма=Кол-во*Цена
Слайд 25Роль показателей
Показатели, описывающие экономические процессы, включают составные части:
Формальная характеристика, указывающая на
алгоритм получения атрибута-основания в показателе;
Перечень объектов в процессе;
Название процесса;
Единица измерения атрибута-основания;
Определение периода или момента времени;
Название функции управления;
Название экономической системы.
Слайд 26Критерий качества создания базы данных
Минимальная избыточность хранимой информации, выражаемая принципом: каждое
сообщение хранится в БД один раз. Соблюдение данного принципа дает следующие преимущества:
Сокращается объем памяти ЭВМ, для хранения БД;
Сокращается трудоемкость ввода данных и упрощаются проблемы контроля достоверности информации;
Упрощаются алгоритмы корректировки данных;
Использование экономических показателей позволяет построить структуру БД с минимальной избыточностью, если сначала расчленить все сведения в ЭИС на показатели, а потом объединить атрибуты родственных показателей по принципу:
в один файл включается группа показателей с одинаковым составом атрибутов-признаков.
Слайд 27Модель арифметических вычислений
Модель арифметических вычислений основывается на графе взаимосвязи показателей.
В
графе G(S,U) множество вершин S={s(i)} представляет собой все показатели, хранящиеся в базе данных. Дуга (ребро графа) u(i,j) задается в том случае, если есть расчетное соотношения для показателя s(j) и оно зависит от показателя s(i).
Графы взаимосвязи показателей служит основой для решения задач:
разделение промежуточных показателей на хранимые и динамически вычисляемые;
распределения файлов по узлам вычислительной сети
Слайд 28Описание экономического процесса
Выделяют семь классов признаков описывающих экономический процесс:
Признаки формальной характеристики
– формальный способ вычисления соответствующего показателя;
Признаки характеристики процесса – характеристики состояний в которых находится описываемый объект (наличие, выпуск, реализация и т.п.)
Признаки объекта – указывают характеризуемый показателем объект (продукция, сырье, персонал и т.п.);
Признаки единицы измерения;
Признаки субъекта – организации, предприятия;
Признаки времени;
Признаки функции управления – принадлежность показателя к определенной функции управления