2. Представление документов в электронном виде
3. Технологии распознавания образов
экономический документ электронный информация
1. Экономический документ, виды и формы представления
В целях организации обработки информации и реализации функций управления показатели могут образовывать более сложные составные структурные единицы информации: документы, массивы, информационные потоки, информационную базу. Экономический документ представляет собой определенным образом организованную совокупность взаимосвязанных по смыслу экономических показателей. Экономический документ является основной и наиболее удобной формой представления информации с точки зрения управления, так как наряду с наглядностью представления информации, Необходимой для решения задачи или являющейся результатом решения задачи, он содержит атрибуты, придающие ему юридический статус.
Экономический документ — совокупность взаимосвязанных по смыслу экономических показателей.
Экономический документ является основной и наиболее удобной формой представления информации с точки зрения управления. Документ содержит атрибуты, придающие ему юридический статус. Электронная форма документа: электронные копии и формы.
Основная форма представления — табличная. (Могут использоваться также документы упрощенной табличной формы, в которых наименования реквизитов приводятся не в шапке (статистической отчетности, финансовой, бухгалтерской, налоговой и т.п.)).
У документа есть общая, предметная и оформительная части. Общая (заголовочная) часть содержит название документа и перечень общих по составу и значению реквизитов для всех показателей (их характеристики), представленных в документе (см. рис.1).
Предметная (основная) часть включает реквизиты, характеризующие особенности экономических показателей многострочного документа.
Рис. 1
Оформительская часть содержит атрибуты, не участвующие а процессах обработки информации, однако они придают документу юридическую силу, так как включают подписи лиц, участвовавших в подготовке документа.
Рис.2
В качестве носителя информации для отображения содержимого документов наиболее распространенными являются:
- Бумажные (бумага),
- электронные (CD-ROM, DVD-ROM),
- магнитные (дискеты).
20 стр., 9811 слов
Информация экономический ресурс
... его по-разному — технология, научно-технический прогресс, наука, информация. Безграничность потребностей и ограниченность экономических ресурсов как основа экономической теории. Как уже отмечалось выше, в жизни мы часто сталкиваемся с ... более полного извлечения и переработки нефти (в настоящее время коэффициент отдачи пластов в среднем для топливных ресурсов составляет около 45%, в том числе для угля ...
В контексте обработки документы делятся на две группы документы и формы. Формы, в отличие от документов, содержат массу избыточной, с точки зрения электронной обработки, информации: линии, пиктограммы, графление и т.д.
Первой операцией ввода формы в компьютер является сканирование. Сканер должен обеспечивать приемлемое разрешение при высокой скорости сканирования и наличие системы автоподачи документов.
Следующей операцией является чистка изображения документа, так как многие бумажные документы содержит пятна, шероховатости, линии сгиба и другие дефекты, которые мы не замечаем. Они переходят в электронный образ документа и сильно мешают при работе. Поэтому проводится очищение изображения. (Кроме того, зачастую документы имеют фон, одноцветный или разноцветный (например, на ценных бумагах), который необходимо снять посредством фильтрации и выделения.)
Третья операция подготавливает документ к распознаванию. Трудности возникают, когда элементы букв пересекаются с элементами форм, а также из-за дефектов бумаги и т.д. Системы распознавания удаляют элементы форм так, чтобы не пострадал текст. В случае перекосов, возникающих при сканировании, применяется операция выравнивания изображения документа.
Следующая операция — распознавание. Системы распознавания делятся на два класса: системы оптического распознавания OCR, которые работают только с полиграфическим текстом и интеллектуальные системы распознавания ICR, работающие с рукописным текстом. Они распознают также штрих-коды, специальные метки.
После того как документ распознан, он поступает в систему управления документами, где проводится его индексация (оформление по стандартам).
2. Представление документов в электронном виде
Электронный документ — любая текстовая, звуковая, графическая и другая неструктурированная информация, созданная с помощью средств компьютерной обработки информации и сохранённая на машинном носителе.
Электронный документ в системе электронного документооборота состоит из текста (содержимого электронного документа) и карточки — формы, содержащей набор атрибутов, описывающих документ (наименование документа, автор, дата создания, корреспондент и т.д.
Электронный документ содержит информацию, которая может быть использована, например, для поиска документа или отнесения его к той или иной группе. Это может быть текст или электронная форма Microsoft Word, таблица Excel или сообщение в формате электронной почты Internet и т.д. Файлы документов могут не содержать внутри себя структурных элементов (обычные текстовые документы) или, наоборот, быть структурированными. Последние внутри себя содержат элементы структуры, позволяющие внешним приложениям получать информацию об отдельных элементах информации (формы Word, электронные таблицы, документы в формате XML).
Microsoft Word — мощный текстовой процессор, предназначенный для выполнения всех процессов обработки текста: от набора и верстки, до проверки орфографии, вставки в текст графики, распечатки текста.
По Экономической информации
... этом форма представления экономической информации может быть алфавитно-цифровой (текстовой) и графической.Физическим носителем входной и выходной информации может быть бумага, магнитный диск, изображение на экране дисплея. 4.Информационная система Данные - информация, ...
Microsoft Excel — программа для работы с электронными таблицами. Она предоставляет возможности экономико-статистических расчетов, так же входит в состав Microsoft Office и на сегодняшний день Excel является одним из наиболее популярных приложений в мире.
По сравнению со своим бумажным аналогом, электронный документ обладает рядом бесспорных преимуществ, таких как долговечность, простота редактирования и прочей работы с ним, а также возможность поиска по ключевым словам и удобство в использовании в автоматизированных системах управления предприятием.
В настоящее время существуют различные форматы электронных документов, наиболее распространенным из которых является платформнонезависимый ODF стандарта ИСО 26300.
Особый тип документов представляют собой записи баз данных специализированных систем автоматизации групповой работы, таких как электронные формы Microsoft Exchange или документы 1С. Подобный документ, в отличие от обычного электронного документа, не представлен в виде отдельного файла, а является целостной единицей информации, которая имеет уникальный идентификатор, средство отображения и модификации. К этой группе документов можно отнести отчеты, порождаемые в результате работы прикладных ИС. Такие документы динамически формируются из записей различных баз данных. После просмотра или вывода на печать подобный документ прекращает свое существование в информационной системе в качестве единого объекта — он «живет» только в рамках определенного приложения, поэтому, например, для передачи в другое подразделение его следует преобразовать в документ иного типа.
Электронный документ приобретает юридическую значимость благодаря электронной цифровой подписи, которая аналогична подписи на бумажном носителе и равнозначна ей, если при этом соблюдаются определенные условия.
Электронные документы так же можно передавать между собой чрез электронные носители.
Известны три способа подготовки электронных носителей информации:
- ручной,
- автоматизированный,
- автоматический.
что в свою очередь предполагает использование и различных технических средств.
При ручном способе подготовки машинных носителей все технологические операции, начиная с восприятия информации, содержащейся в первичных документах, ее перенос на промежуточный носитель и контроль правильности введенной информации осуществляет человек-оператор.
При автоматизированном способе изготовление электронного документа осуществляется уже в момент составления первичного документа. Это достигается путем объединения обычных средств документирования со специальными техническими устройствами, например перфорирующими, как со средствами автоматического считывания письменной или графической информации (сканеры).
При автоматическом способе изготовление электронного документа речь идет о работе специализированных программ обработки и переработки информации, итоговые протоколы которых могут рассматриваться как автоматически созданные документы.
3. Технологии распознания образов
Методы автоматического распознавания образов— одна из самых плодотворных технологий . В развитии этой технологии российские ученые и разработчики занимают ведущие позиции в мире.
В приведенной трактовке OCR понимается как автоматическое распознавание с помощью специальных программ изображений символов печатного или рукописного текста (например, введенного в компьютер с помощью сканера) и преобразование его в формат, пригодный для обработки текстовыми процессорами, редакторами текстов и т.д. Автоматическое чтение печатных и рукописных текстов является частным случаем автоматического визуального восприятия сложных изображений. Для решения этой задачи необходимо интеллектуальное распознавание. Однако в настоящее время в технически реализуемых OCR-системах рассматриваемая проблема значительно упрощена и сведена к задаче классификации по признакам простых объектов. Эта задача описывается хорошо разработанным математическим аппаратом пороговых отделителей — разделяющими плоскостями. В современных OCR-системах используется технология распознавания, свойственная человеку. У человека распознавание образа является многоступенчатым.
Технические средства защиты от утечки информации
... информации. 1.1. Анализ Современных технологий защиты от утечки конфиденциальной информации На сегодняшний день автоматизированные системы являются основой ... др.; вывод на печать конфиденциальной информации и вынос распечатанных документов за пределы контролируемой территории. ... Каналы утечки конфиденциальной информации Модель нарушителя, которая используется в данной курсовой работе, предполагает, что ...
Выделяются три принципа, на которых основаны все OCR-системы:
- Принцип целостности образа (integrity);
- Принцип целенаправленности (purposefulness);
- Принцип адаптивности (adaptability).
Рис. 3 Общая схема распознавания текста
Графический образ символа на выходе сканера имеет вид шейпа, представляющего собой матрицу из точек, которую можно редактировать поэлементно.
Примеры задач распознавания образов:
- Распознавание букв;
- Распознавание штрих-кодов;
- Распознавание автомобильных номеров;
- Распознавание лиц и других биометрических данных;
- Распознавание речи.