Силаенков А.Н. Информационные технологии. Учебное пособие - файл n1.doc

приобрести
Силаенков А.Н. Информационные технологии. Учебное пособие
скачать (1989 kb.)
Доступные файлы (1):
n1.doc1989kb.07.07.2012 01:23скачать

n1.doc

1   2   3   4   5   6   7   8   9   10

3. Основные принципы создания пользовательского интерфейса.


4. Что такое человеко-машинное взаимодействие (HCI)?

5. Что относится к управляющим средствам пользовательского интерфейса?

6. Каковы нормативные требования по эргономике пользовательского интерфейса?

7. Какие подходы применяются для оценки эргономического качества интерфейса?

8. Как проектируют меню?

9. Использование форм при проектировании интерфейса.

10. Навигация в пользовательском интерфейсе.

4. ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ ОБРАБОТКИ ДАННЫХ

4.1.Комплексный подход к обработке информации

Комплексный подход к задачам, возникающим при обработке информации, позволяет решить вопросы повышения надежности и стабильности, гибкости и масштабируемости систем, их управляемости, возможности модернизации используемого аппаратного и программного обеспечения.

Комплексность отражается в одновременном рассмотрении таких важных аспектов, как: ценовая политика, решение сервисных вопросов, упрощение администрирования, обеспечение защиты, режим работы при восстановлении и других.

Задачи, возникающие при обработке данных, следует решать на трех уровнях: физическом, логическом и приложений.

При построении системы обработки данных целесообразно обращать особое внимание на организацию следующих возможностей:

4.2. Характеристика и назначение информационных технологий обработки данных

Информационная технология обработки данных предназначена для решения хорошо струк­турированных задач, по которым имеются необходимые входные данные и известны алго­ритмы и другие стандартные процедуры их обработки. Эта технология применяется на уровне операционной (исполнительской) деятельности персонала невысокой квалификации в целях автоматизации некоторых рутинных, постоянно повторяющихся опе­раций управленческого труда. Поэтому внедрение информационных технологий и систем на этом уровне существенно повысит производительность труда персонала, освободит его от рутинных операций.

На уровне операционной деятельности решаются следующие задачи:

• обработка данных об операциях, производимых фирмой;

• создание периодических контрольных отчетов о состоянии дел в фирме;

• получение ответов на всевозможные текущие запросы и оформление их в виде бумажных документов или отчетов.

Существует несколько особенностей, связанных с обработкой данных, отличающих данную технологию от всех прочих:

• выполнение необходимых фирме задач по обработке данных. Каждой фирме предпи­сано законом иметь и хранить данные о своей деятельности, которые можно использо­вать как средство обеспечения и поддержания контроля на фирме. Поэтому в любой фирме обязательно должна быть информационная система обработки данных и разра­ботана соответствующая информационная технология;

• решение только хорошо структурированных задач, для которых можно разработать алгоритм;

• выполнение стандартных процедур обработки. Существующие стандарты определяют типовые процедуры обработки данных и предписывают их соблюдение организация­ми всех видов;

• выполнение основного объема работ в автоматическом режиме с минимальным учас­тием человека;

• использование детализированных данных. Записи о деятельности фирмы имеют де­тальный (подробный) характер, допускающий проведение ревизий. В процессе реви­зии деятельность фирмы проверяется хронологически от начала периода к его концу и от конца к началу;

• акцент на хронологию событий;

• требование минимальной помощи в решении проблем со стороны специалистов дру­гих уровней.

4.3. Основные компоненты информационной технологии обработки данных

Приведём основные компоненты информационной технологии обработки данных и их характеристики.

Сбор данных. По мере того как фирма производит продукцию или услуги, каждое ее действие сопровождается соответствующими записями данных. Обычно действия фирмы, затрагивающие внешнее окружение, выделяются особо, как операции, производи­мые фирмой.

Обработка данных. Для создания из поступающих данных информации, отра­жающей деятельность фирмы, используются следующие типовые операции:

• классификация или группировка. Первичные данные обычно имеют вид кодов, состоя­щих из одного или нескольких символов. Эти коды, выражающие определенные при­знаки объектов, используются для идентификации и группировки записей;

• сортировка, с помощью которой упорядочивается последовательность записей;

• вычисления, включающие арифметические и логические операции, которые вы­полняются над данными и дают возможность получать новые данные;

• укрупнение или агрегирование, служащее для уменьшения количества данных и реа­лизуемое в форме расчетов итоговых или средних значений.

Хранение данных. Многие данные на уровне операционной деятельности необ­ходимо сохранять для последующего использования либо здесь же, либо на другом уровне. Для их хранения создаются базы данных.

Создание отчетов (документов). В информационной технологии обра­ботки данных необходимо создавать документы для руководства и работников фирмы, а также для внешних партнеров. При этом документы могут создаваться как по запросу или в связи с проведенной фирмой операцией, так и периодически в конце каждого месяца, квар­тала или года.

4.4. Хранилища данных

4.4.1. Концепция хранилища данных

Определение понятия «хранилище данных» первым дал Уильям Инмон как «предметно-ориентированной, интегрированной, содержащей исторические данные, неразрушаемой совокупности данных, предназначенной для поддержки принятия управленческих решений».

Информационное хранилище характеризуется четырьмя важными особенностями:

 объектно-ориентированная база данных, в которой данные организованы в соответствии с их содержанием, а не прикладными программами;

 цельность, связанная с преобразованием кодов блоков данных, полученных из различных баз данных;

 этапность, определяющая сбор информации за определенный интервал времени;

 защищенность, запрещающая изменять либо обновлять данные, помещенные в хранилище.

В основе концепции хранилища данных лежат две основные идеи: интеграция разъединенных детализированных данных (описывающих некоторые конкретные факты, свойства, события и т. д.) в едином хранилище и разделение наборов данных и приложений, используемых для обработки и анализа.

Здесь процесс обработки данных разделяется на два этапа. Первый из них связан с обработкой транзакций в реальном времени (OLTP). В результате чего в базах данных накапливается первичная информация о функционировании предприятия либо организации. Например, банка. На втором этапе осуществляется аналитическая обработка в реальном времени (OLAP). Например, анализ снятия наличности со счетов, планирование объема оказываемых услуг, показатели эффективности работы служащих, отделений и всего банка.

Технология OLAP обладает значительным числом преимуществ, к которым, в первую очередь, относятся:

 многомерное представление данных,

 высокая производительность,

 динамическая обработка массивов,

 гибкость средств генерации отчетов.

При работе хранилища выполняются преобразования, обеспечивающие работу баз данных различных типов с разными форматами документов. В свою очередь хранилище используется для выполнения прикладных процессов. Информационное хранилище обслуживает запросы, анализирует результаты их выполнения и формирует отчеты. Оно также обеспечивает загрузку данных и периодическое удаление информации, утратившей актуальность.

4.4.2. Определение и типовые архитектуры хранилищ данных

Концептуально модель хранилища данных можно представить в виде схемы на рис. 7. Данные из различных источников помещают в хранилище, а их описания — в репозиторий метаданных.

Репозиторий — место для хранения данных, моделей, интерфейсов и программных реализаций.

Метаданные – данные о данных: каталоги, справочники, реестры, базы метаданных, содержащие сведения о составе данных, содержании, статусе, происхождении, местонахождении, качестве, форматах и формах представления, условиях доступа, приобретения и использования, авторских, имущественных и смежных с ними правах на данные и другое.

Конечный пользователь, используя различные инструменты (средства визуализации, построения отчетов, статистической обработки и т. д.) и содержимое репозитория, анализирует данные в хранилище. Результатом является информация в виде готовых отчетов, найденных скрытых закономерностей, каких-либо прогнозов. Так как средства работы конечного пользователя с хранилищем данных могут быть самыми разнообразными, то теоретически их выбор не должен влиять на структуру хранилища и функции его поддержания в актуальном состоянии. Физическая реализация данной концептуальной схемы может быть самой разнообразной.






Рис. 7. Модель хранилища данных

В информационном хранилище используется методология метаданных, благодаря этому блоки базы превращаются в единый работоспособный объект. Все форматы представления метаданных жестко связаны с прикладной программой, которая их использует. Метаданные необходимы для описания каталогов и схем расположения данных. Метаданные позволяют также определять время, источник и приемник данных, алгоритм выполненного преобразования. Это нужно тогда, когда необходимо найти первичную информацию, на которой основывались обобщения.
Наряду с большими универсальными базами данных с помощью информационных баз также создаются тематические комплексы, касающиеся разных аспектов деятельности предприятия либо организации. Простые типы информационных баз используются в информационных витринах.

Информационные витрины обеспечивают сотрудников тематической информацией, касающейся финансов, материальных запасов, персонала и т. д. Витрины дают возможность обойтись без создания единого физического хранилища. Для каждого подразделения можно иметь свою витрину, на которой отображать всю информацию, необходимую этому подразделению.
В системах управления приобретением знаний используются разновидности информационных хранилищ, именуемые хранилищами знаний.

Виртуальное хранилище данных — это система, предоставляющая интерфейсы и методы доступа к регистрирующей системе, которые эмулируют работу с данными в этой системе, как с хранилищем данных. Виртуальное хранилище данных можно организовать, создав ряд «представлений» (view) в базе данных либо применив специальные средства доступа. Главными достоинствами такого подхода являются: простота и малая стоимость реализации, единая платформа с источником информации, отсутствие сетевых соединений между источником информации и хранилищем данных. Однако недостатков гораздо больше. Создавая виртуальное хранилище данных, пользователь создает не хранилище как таковое, а иллюзию. Структура хранения и само хранение не претерпевают изменений, и остаются проблемы: производительности, трансформации данных, интеграции данных с другими источниками, отсутствие истории, чистоты данных, зависимость от доступности и структуры основной базы данных.

Двухуровневая архитектура хранилища данных подразумевает построение витрин данных (data mart) без создания центрального хранилища, при этом информация поступает из регистрирующих систем и ограничена конкретной предметной областью. При построении витрин используются основные принципы построения хранилищ данных, поэтому их можно считать хранилищами данных в миниатюре. Плюсы: простота и малая стоимость реализации; высокая производительность за счет физического разделения регистрирующих и аналитических систем, выделения загрузки и трансформации данных в отдельный процесс, оптимизированной под анализ структурой хранения данных; поддержка истории; возможность добавления метаданных.

Построение полноценного корпоративного хранилища данных обычно выполняется в трехуровневой архитектуре. На первом уровне расположены разнообразные источники данных — внутренние регистрирующие системы, справочные системы, внешние источники (данные информационных агентств, макроэкономические показатели). Второй уровень содержит центральное хранилище, куда стекается информация от всех источников с первого уровня, и, возможно, оперативный склад данных, который не содержит исторических данных и выполняет две основные функции. Во-первых, он является источником аналитической информации для оперативного управления, и, во-вторых, здесь подготавливаются данные для последующей загрузки в центральное хранилище. Под подготовкой данных понимают их преобразование и проведение определенных проверок. Наличие оперативного склада данных просто необходимо при различном регламенте поступления информации из источников. Третий уровень представляет собой набор предметно-ориентированных витрин данных, источником информации для которых является центральное хранилище данных. Именно с витринами данных и работает большинство конечных пользователей.

4.4.3. Проектирование структуры реляционного хранилища данных

Хранилища строятся на основе многомерной модели данных, подразумевающей выделение отдельных измерений (время, география, клиент, счет) и фактов (объем продаж, доход, количество товара) с их анализом по выбранным измерениям. Многомерная модель данных физически может быть реализована как в многомерных, так и в реляционных СУБД. В последнем случае она выполняется по схеме «звезда» или «снежинка». Данные схемы предполагают выделение таблиц фактов и таблиц измерений. Каждая таблица фактов содержит детальные данные и внешние ключи на таблицы измерений.

4.5. Оперативная аналитическая обработка данных (OLAP)

В основе концепции OLAP лежит принцип многомерного представления данных. В 1993 году в статье E. F. Codd рассмотрел недостатки реляционной модели, в первую очередь, указав на невозможность "объединять, просматривать и анализировать данные с точки зрения множественности измерений, то есть самым понятным для корпоративных аналитиков способом", и определил общие требования к системам OLAP, расширяющим функциональность реляционных СУБД и включающим многомерный анализ как одну из своих характеристик.

По Кодду, многомерное концептуальное представление (multi-dimensional conceptual view) представляет собой множественную перспективу, состоящую из нескольких независимых измерений, вдоль которых могут быть проанализированы определенные совокупности данных. Одновременный анализ по нескольким измерениям определяется как многомерный анализ. Каждое измерение включает направления консолидации данных, состоящие из серии последовательных уровней обобщения, где каждый вышестоящий уровень соответствует большей степени агрегации данных по соответствующему измерению. Так измерение Исполнитель может определяться направлением консолидации, состоящим из уровней обобщения «предприятие — подразделение — отдел — служащий». Измерение Время может даже включать два направления консолидации: «год — квартал — месяц — день» и «неделя — день», поскольку счет времени по месяцам и по неделям несовместим (рис. 8).



Рис. 8. Измерения и направления консолидации данных

4.5.1. Требования к средствам оперативной аналитической обработки

Кодд определил 12 правил, которым должен удовлетворять программный продукт класса OLAP (табл. 6).

Таблица 6

Правила оценки программных продуктов класса OLAP

1

Многомерное концептуальное представление данных (Multi-Dimensional Conceptual View)

Концептуальное представление модели данных в продукте OLAP должно быть многомерным по своей природе, то есть позволять аналитикам выполнять интуитивные операции "анализа вдоль и поперек" ("slice and dice"), вращения (rotate) и размещения (pivot) направлений консолидации

2

Прозрачность (Transparency)

Пользователь не должен знать о том, какие конкретные средства используются для хранения и обработки данных, как данные организованы и откуда берутся

3

Доступность (Accessibility)

Аналитик должен иметь возможность выполнять анализ в рамках общей концептуальной схемы, но при этом данные могут оставаться под управлением оставшихся от старого наследства СУБД, будучи при этом привязанными к общей аналитической модели. То есть инструментарий OLAP должен накладывать свою логическую схему на физические массивы данных, выполняя все преобразования, требующиеся для обеспечения единого, согласованного и целостного взгляда пользователя на информацию

4

Устойчивая производительность (Consistent Reporting Performance)

С увеличением числа измерений и размеров базы данных аналитики не должны столкнуться с каким бы то ни было уменьшением производительности. Устойчивая производительность необходима для поддержания простоты использования и свободы от усложнений, которые требуются для доведения OLAP до конечного пользователя

5

Клиент—серверная архитектура (Client—Server Architecture)

Большая часть данных, требующих оперативной аналитической обработки, хранится на сервере, а извлекается клиентом. Поэтому одним из требований является способность продуктов OLAP работать в среде клиент—сервер. Главной идеей здесь является то, что серверный компонент OLAP должен быть достаточно интеллектуальным и обладать способностью строить общую концептуальную схему на основе обобщения и консолидации различных логических и физических схем корпоративных баз данных для обеспечения эффекта прозрачности

6

Равноправие измерений (Generic Dimensionality)

В
Продолжение таблицы 6
се измерения данных должны быть равноправны. Дополнительные характеристики могут быть предоставлены отдельным измерениям, но поскольку все они симметричны, данная дополнительная функциональность может быть предоставлена любому измерению. Базовая структура данных, формулы и форматы отчетов не должны опираться на какое-то одно измерение

7

Динамическая обработка разреженных матриц (Dynamic Sparse Matrix Handling)

Инструмент OLAP должен обеспечивать оптимальную обработку разреженных матриц. Скорость доступа должна сохраняться вне зависимости от расположения ячеек данных и быть постоянной величиной для моделей, имеющих разное число измерений и различную разреженность данных

8

Поддержка многопользовательского режима (Multi-User Support)

Зачастую несколько аналитиков имеют необходимость работать одновременно с одной аналитической моделью или создавать различные модели на основе одних корпоративных данных. Инструмент OLAP должен предоставлять им конкурентный доступ, обеспечивать целостность и защиту данных

9

Неограниченная поддержка кроссмерных операций (Unrestricted Cross-dimensional Operations)

Вычисления и манипуляция данными по любому числу измерений не должны запрещать или ограничивать любые отношения между ячейками данных. Преобразования, требующие произвольного определения, должны задаваться на функционально полном формульном языке

10

Интуитивное манипулирование данными (Intuitive Data Manipulation)

Переориентация направлений консолидации, детализация данных в колонках и строках, агрегация и другие манипуляции, свойственные структуре иерархии направлений консолидации, должны выполняться в максимально удобном, естественном и комфортном пользовательском интерфейсе

11

Гибкий механизм генерации отчетов (Flexible Reporting)

Должны поддерживаться различные способы визуализации данных, то есть отчеты должны представляться в любой возможной ориентации

12

Неограниченное количество измерений и уровней агрегации (Unlimited Dimensions and Aggregation Levels)

Настоятельно рекомендуется допущение в каждом серьезном OLAP инструменте как минимум пятнадцати, а лучше двадцати, измерений в аналитической модели. Более того, каждое из этих измерений должно допускать практически неограниченное количество определенных пользователем уровней агрегации по любому направлению консолидации

Набор этих требований, послуживших фактическим определением OLAP, следует рассматривать как рекомендательный, а конкретные продукты оценивать по степени приближения к идеально полному соответствию всем требованиям.

4.5.2. Классификация продуктов OLAP по способу представления данных

Обеспечивая многомерное концептуальное представление со стороны пользовательского интерфейса к исходной базе данных, все продукты OLAP делятся на три класса по типу исходной БД:

  1. MOLAP. Системы оперативной аналитической обработки MOLAP могут работать только со своими собственными многомерными базами данных.

Данные организованы не в форме реляционных таблиц, а в виде упорядоченных многомерных массивов:

1) гиперкубов (все хранимые в БД ячейки должны иметь одинаковую мерность, то есть находиться в максимально полном базисе измерений);

2) поликубов (каждая переменная хранится с собственным набором измерений, и все связанные с этим сложности обработки перекладываются на внутренние механизмы системы).

Использование многомерных БД в системах оперативной аналитической обработки имеет следующие достоинства:

  1. В случае использования многомерных СУБД поиск и выборка данных осуществляется значительно быстрее, чем при многомерном концептуальном взгляде на реляционную базу данных, так как многомерная база данных денормализована, содержит заранее агрегированные показатели и обеспечивает оптимизированный доступ к запрашиваемым ячейкам.

  2. Многомерные СУБД легко справляются с задачами включения в информационную модель разнообразных встроенных функций, тогда как объективно существующие ограничения языка SQL делают выполнение этих задач на основе реляционных СУБД достаточно сложным, а иногда и невозможным.

С другой стороны, имеются существенные ограничения.

  1. Многомерные СУБД не позволяют работать с большими базами данных. К тому же за счет денормализации и предварительно выполненной агрегации объем данных в многомерной базе, как правило, соответствует (по оценке Кодда) в 2,5—100 раз меньшему объему исходных детализированных данных.

  2. Многомерные СУБД очень неэффективно используют внешнюю память. Следовательно, использование многомерных СУБД оправдано только при следующих условиях:

1) объем исходных данных для анализа не слишком велик (не более нескольких гигабайт), то есть уровень агрегации данных достаточно высок;

2) набор информационных измерений стабилен (поскольку любое изменение в их структуре почти всегда требует полной перестройки гиперкуба);

3) время ответа системы на нерегламентированные запросы является наиболее критичным параметром;

4) требуется широкое использование сложных встроенных функций для выполнения кроссмерных вычислений над ячейками гиперкуба, в том числе возможность написания пользовательских функций.

MOLAP основываются на патентованных технологиях для многомерных СУБД и являются наиболее дорогими. Эти системы обеспечивают полный цикл OLAP-обработки. Они либо включают в себя, помимо серверного компонента, собственный интегрированный клиентский интерфейс, либо используют для связи с пользователем внешние программы работы с электронными таблицами. Для обслуживания таких систем требуется специальный штат сотрудников, занимающихся установкой, сопровождением системы, формированием представлений данных для конечных пользователей.

  1. ROLAP. Системы оперативной аналитической обработки реляционных данных (ROLAP) позволяют представлять данные, хранимые в реляционной базе, в многомерной форме, обеспечивая преобразование информации в многомерную модель через промежуточный слой метаданных. ROLAP—системы хорошо приспособлены для работы с крупными хранилищами.

Непосредственное использование реляционных БД в системах оперативной аналитической обработки имеет следующие достоинства.

  1. В большинстве случаев корпоративные хранилища данных реализуются средствами реляционных СУБД, и инструменты ROLAP позволяют производить анализ непосредственно над ними. При этом размер хранилища не является таким критичным параметром, как в случае MOLAP.

  2. В случае переменной размерности задачи, когда изменения в структуру измерений приходится вносить достаточно часто, ROLAP—системы с динамическим представлением размерности являются оптимальным решением, так как в них такие модификации не требуют физической реорганизации БД.

  3. Реляционные СУБД обеспечивают значительно более высокий уровень защиты данных и хорошие возможности разграничения прав доступа.

Главный недостаток ROLAP по сравнению с многомерными СУБД — меньшая производительность. Для обеспечения производительности, сравнимой с MOLAP, реляционные системы требуют тщательной проработки схемы базы данных и настройки индексов, то есть больших усилий со стороны администраторов БД. Подобно системам MOLAP, они требуют значительных затрат на обслуживание специалистами по информационным технологиям и предусматривают многопользовательский режим работы.

  1. HOLAP. Гибридные системы (Hybrid OLAP, HOLAP) разработаны с целью совмещения достоинств и минимизации недостатков, присущих предыдущим классам. Они объединяют аналитическую гибкость и скорость ответа MOLAP с постоянным доступом к реальным данным, свойственным ROLAP.

Помимо перечисленных средств существует еще один класс — инструменты генерации запросов и отчетов для настольных ПК, дополненные функциями OLAP или интегрированные с внешними средствами, выполняющими такие функции. Эти хорошо развитые системы осуществляют выборку данных из исходных источников, преобразуют их и помещают в динамическую многомерную БД, функционирующую на клиентской станции конечного пользователя.

4.6. Интеллектуальный анализ данных (ИАД)

ИАД (Data Mining) — это процесс поддержки принятия решений, основанный на поиске в данных скрытых закономерностей (шаблонов информации). При этом накопленные сведения автоматически обобщаются до информации, которая может быть охарактеризована как знания.

В общем случае процесс ИАД состоит из трёх стадий (рис. 9):

1) выявление закономерностей (свободный поиск);

2) использование выявленных закономерностей для предсказания неизвестных значений (прогностическое моделирование);

3) анализ исключений, предназначенный для выявления и толкования аномалий в найденных закономерностях.

Иногда в явном виде выделяют промежуточную стадию проверки достоверности найденных закономерностей между их нахождением и использованием.

Все методы ИАД подразделяются на две большие группы по принципу работы с исходными обучающими данными:

  1. В первом случае исходные данные могут храниться в явном детализированном виде и непосредственно использоваться для прогностического моделирования и/или анализа исключений; это так называемые методы рассуждений на основе анализа прецедентов. Главной проблемой этой группы методов является затрудненность их использования на больших объемах данных, хотя именно при анализе больших хранилищ данных методы ИАД приносят наибольшую пользу.

2. Во втором случае информация вначале извлекается из первичных данных и преобразуется в некоторые формальные конструкции (их вид зависит от конкретного метода). Согласно предыдущей классификации, этот этап выполняется на стадии свободного поиска, которая у методов первой группы в принципе отсутствует.



Рис. 9. Стадии процесса интеллектуального анализа данных

Таким образом, для прогностического моделирования и анализа исключений используются результаты этой стадии, которые гораздо более компактны, чем сами массивы исходных данных. Две эти группы и примеры входящих в них методов представлены на рис. 10.



Рис. 10. Классификация технологических методов ИАД

4.7. Интеграция OLAP и ИАД

Оперативная аналитическая обработка и интеллектуальный анализ данных— две составные части процесса поддержки принятия решений. Но сегодня большинство систем OLAP заостряет внимание только на обеспечении доступа к многомерным данным, а большинство средств ИАД, работающих в сфере закономерностей, имеют дело с одномерными перспективами данных. Эти два вида анализа должны быть тесно объединены, то есть системы OLAP должны фокусироваться не только на доступе, но и на поиске закономерностей.

K. Parsaye ввёл составной термин «OLAP Data Mining» (многомерный интеллектуальный анализ) для обозначения такого объединения (рис. 11).

J. Han предложил еще более простое название — «OLAP Mining» и привёл несколько вариантов интеграции двух технологий:

  1. «Cubing then mining». Возможность выполнения интеллектуального анализа должна обеспечиваться над любым результатом запроса к многомерному концептуальному представлению, то есть над любым фрагментом любой проекции гиперкуба показателей.



Рис. 11. Архитектура системы многомерного интеллектуального анализа данных

  1. «Mining then cubing». Подобно данным, извлечённым из хранилища, результаты интеллектуального анализа должны представляться в гиперкубической форме для последующего многомерного анализа.

  2. «Cubing while mining». Этот гибкий способ интеграции позволяет автоматически активизировать однотипные механизмы интеллектуальной обработки результатов каждого шага многомерного анализа (перехода между уровнями обобщения, извлечения нового фрагмента гиперкуба и т. д.).

4.8. Data Marts

Резкое увеличение объемов корпоративных данных за последние несколько лет привело к проблемам обработки и своевременного анализа информации. В рамках идеологии открытых систем все чаще возникает потребность в использовании распределенных систем, в которых пользователь не зависит от физического нахождения информации, необходимой для работы, используя дешевые технологии Интернет и Интранет.

Новая технология витрин данных (Data Marts), представляющих собой массивы тематической, узконаправленной информации, ориентированные на пользователей одной рабочей группы или департамента, предоставляет возможность сколь угодно глубокого и сложного анализа данных. Естественным шагом явилась разработка программных и аппаратных комплексов, интегрирующих витрины данных для систем поддержки принятия решений. Данная технология позволяет осуществить переход от традиционных OLTP-систем к DM-системам без существенных затрат на новое аппаратное обеспечение, производить построение витрин данных итерационно.

Вопросы для самоконтроля

1. В чём заключается комплексный подход к обработке информации?

2. Каковы особенности информационных технологий, связанных с обработкой данных?

3. Виртуальное хранилище данных. Его достоинства и недостатки.

4. Какова архитектура хранилищ данных?

5. Назовите требования к средствам оперативной аналитической обработки (OLAP).

6. Достоинства и недостатки различных технологий OLAP.

7. Укажите достоинства и недостатки интеллектуального анализа данных (ИАД).

8. Укажите группы ИАД для работы с исходными обучающими данными.

9. Какие составные части процесса поддержки принятия решений вам известны?

10. Назовите варианты интеграции OLAP и ИАД.
5. ТЕХНОЛОГИЧЕСКИЙ ПРОЦЕСС ОБРАБОТКИ И ЗАЩИТЫ ДАННЫХ

В процессах автоматизированной обработки экономической информации (АОЭИ) в качестве объекта, подвергающегося преобразованиям, выступают различного рода данные, которые характеризуют те или иные экономические явления. Такие процессы именуются технологическими процессами АОЭИ и представляют собой комплекс взаимосвязанных операций, протекающих в установленной последовательности. Или, более детально, это процесс преобразования исходной информации в выходную с использованием технических средств и ресурсов.

Рациональное проектирование технологических процессов обработки данных в ЭИС во многом определяет эффективное функционирование всей системы.

Весь технологический процесс обработки данных можно подразделить на процессы:

Технологический процесс обработки данных можно разделить на четыре укрупненных этапа:

1) начальный или первичный (сбор исходных данных, их регистрация и передача на ВУ);

2) подготовительный (прием, контроль, регистрация входной информации и перенос ее на машинный носитель);

3) основной (непосредственно обработка информации);

4) заключительный (контроль, выпуск и передача результатной информации, ее размножение и хранение).

5.1. Технологические операции сбора, передачи, хранения, контроля и обработки данных

В зависимости от используемых технических средств и требований к технологии обработки информации изменяется и состав операций технологического процесса. Например, информация на ВУ может поступать на МН, подготовленные для ввода в ЭВМ, или передаваться по каналам связи с места ее возникновения.

Операции сбора и регистрации данных осуществляются с помощью различных средств. Различают:

- механизированный сбор и регистрация информации осуществляется непосредственно человеком с использованием простейших приборов (весы, счетчики, мерная тара, приборы учета времени и т. д.);

- автоматизированный сбор осуществляется с использованием машиночитаемых документов, регистрирующих автоматов, универсальных систем сбора и регистрации, обеспечивающих совмещение операций формирования первичных документов и получения машинных носителей;

- автоматический способ сбора используется в основном при обработке данных в режиме реального времени (информация с датчиков, учитывающих ход производства — выпуск продукции, затраты сырья, простои оборудования и т. д., поступает непосредственно в ЭВМ).

Технические средства передачи данных включают:

- аппаратуру передачи данных (АПД), которая соединяет средства обработки и подготовки данных с телеграфными, телефонными и широкополосными каналами связи;

- устройства сопряжения ЭВМ с АПД, которые управляют обменом информации — мультиплексоры передачи данных.

Запись и передача информации по каналам связи в ЭВМ имеет следующие преимущества:

- упрощает процесс формирования и контроля информации;

- соблюдается принцип однократной регистрации информации в первичном документе и машинном носителе;

- обеспечивается высокая достоверность информации, поступающей в ЭВМ.

Дистанционная передача данных, основанная на использовании каналов связи, представляет собой передачу данных в виде электрических сигналов, которые могут быть непрерывными во времени и дискретными, т. е. носить прерывный во времени характер. Наиболее широко используются телеграфные и телефонные каналы связи. Электрические сигналы, передаваемые по телеграфному каналу связи, являются дискретными, а по телефонному — непрерывными.

При обмене данными между узлами используются три метода передачи данных:

-  симплексная (однонаправленная) передача (телевидение, радио);

-  полудуплексная (прием/передача информации осуществляется поочередно);

- дуплексная (двунаправленная), каждая станция одновременно передает и принимает данные.

Для передачи данных в информационных системах наиболее часто применяется последовательная передача. Широко используются следующие методы последовательной передачи: асинхронная и синхронная (рис. 12).

При асинхронной передаче каждый символ передается отдельной посылкой. Стартовые биты предупреждают приемник о начале передачи. Затем передается символ. Для определения достоверности передачи используется бит четности (бит четности =1, если количество единиц в символе нечетно, и 0 — в противном случае). Последний бит "стоп бит" сигнализирует об окончании передачи.



Рис. 12. Асинхронная и синхронная передача данных

Преимущества: несложная отработанная система; недорогое (по сравнению с синхронным) интерфейсное оборудование.

Недостатки:

Асинхронная передача используется в системах, где обмен данными происходит время от времени и не требуется высокая скорость передачи данных. Некоторые системы используют бит четности как символьный бит, а контроль информации выполняется на уровне протоколов обмена данными (Xmodem, Zmodem, MNP).

При использовании синхронного метода данные передаются блоками. Для синхронизации работы приемника и передатчика в начале блока передаются биты синхронизации. Затем передаются данные, код обнаружения ошибки и символ окончания передачи. При синхронной передаче данные могут передаваться и как символы, и как поток битов. В качестве кода обнаружения ошибки обычно используется Циклический Избыточный Код Обнаружения Ошибок (CRC). Он вычисляется по содержимому поля данных и позволяет однозначно определить достоверность принятой информации.

Преимущества: высокая эффективность передачи данных; высокие скорости передачи данных; надежный встроенный механизм обнаружения ошибок.

Недостатки: интерфейсное оборудование более сложное и, соответственно, более дорогое.

Протоколы SDLC и HDLC основываются на синхронной бит-ориентированной передаче данных.

Каналы характеризуются скоростью передачи данных, достоверностью, надежностью передачи.

Скорость передачи определяется количеством информации, передаваемой в единицу времени, и измеряется в бодах (бод = бит/сек).

Телеграфные каналы (низкоскоростные V=50—200 бод);

Телефонные (среднескоростные —V=200—2400 бод);

Широкополосные (высокоскоростные — V=4800 бод и более).

При выборе наилучшего способа передачи информации учитываются объемные и временные параметры доставки, требования к качеству передаваемой информации, трудовые и стоимостные затраты на передачу информации.

Говоря о технологических операциях сбора, регистрации, передачи информации с помощью различных технических средств, необходимо несколько слов сказать и о сканирующих устройствах.

Ввод информации, особенно графической, с помощью клавиатуры в ЭВМ очень трудоемок. В последнее время наметились тенденции применения деловой графики — одного из основных видов информации, что требует оперативности ввода в ЭВМ и предоставления пользователям возможности формирования гибридных документов и БД, объединяющих графику с текстом. Все эти функции в ПЭВМ выполняют сканирующие устройства. Они реализуют оптический ввод информации и преобразование ее в цифровую форму с последующей обработкой.

Сканирующие устройства применяются не только для ввода текстовой и графической информации, но и в системах контроля, обработки писем, выполнения различных учетных функций.

Для указанных задач наибольшее применение нашли способы кодирования информации штриховыми кодами. Сканирование штриховых кодов для ввода информации в ПЭВМ производится с помощью миниатюрных сканеров, напоминающих карандаш. Сканер перемещается пользователем перпендикулярно группе штрихов, внутренний источник света освещает область этого набора непосредственно около наконечника сканера. Штриховые коды нашли широкое применение и в сфере торговли, и на предприятиях.
1   2   3   4   5   6   7   8   9   10


3. Основные принципы создания пользовательского интерфейса
Учебный материал
© nashaucheba.ru
При копировании укажите ссылку.
обратиться к администрации