Контрольная работа Класи технологій проектування. Поняття і основні системи кодування економічної інформації. Проек
Работа добавлена на сайт bukvasha.net: 2015-10-25Поможем написать учебную работу
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
от 25%
договор
МІНІСТЕРСТВО ОСВІТИ ТА НАУКИ УКРАЇНИ
Бердичівський коледж промисловості, економіки та права
ЗАОЧНЕ ВІДДІЛЕННЯ
КОНТРОЛЬНА РОБОТА
з дисципліни
«Проектування автоматизованих інформаційних систем"
Варіант № 7
Бердичів
2010
Зміст
1. Класи технологій проектування
2. Поняття і основні системи кодування економічної інформації
3. Проектування процесу введення паперових документів
Список використаної літератури
1. Класи технологій проектування
Поєднання різних ознак класифікації методів проектування обумовлює характер використовуваної технології проектування ЭИС, серед яких виділяються два основні класи : канонічна і індустріальна технології. Індустріальна технологія проектування, у свою чергу, розбивається на два підкласи: автоматизоване (використання CASE - технологій) і типове (параметрично - орієнтоване або модельно-орієнтоване) проектування. Використовування індустріальних технологій проектування не виключене використання в окремих випадках канонічної технології.
Характеристики класів технологій проектування
Клас технології проектування | Міра автоматизації | Міра типізації | Міра адаптивності |
Канонічне проектування | Ручне проектування | Оригінальне проектування | Реконструкція |
Індустріальне автоматизоване проектування | Комп'ютерне проектування | Оригінальне проектування | Реструктуризація моделі (генерація ЭИС) |
Індустріальне типове проектування | Комп'ютерне проектування | Типове складальне проектування | Параметризація і реструктуризація моделі (конфігурація ЭИС) |
Для конкретних видів технологій проектування властиво застосування певних засобів розробки ЭИС, які підтримують виконання як окремих проектних робіт, етапів, так і їх сукупностей. Тому перед розробниками ЭИС, як правило, стоїть завдання вибирання засобів проектування, які за своїми характеристиками найбільшою мірою відповідають вимогам конкретного підприємства.
Засоби проектування мають бути:
1. у своєму класі інваріантними до об'єкту проектування;
2. охоплювати в сукупності усі етапи життєвого циклу ЭИС;
3. технічно, програмно і інформаційно сумісними;
4. простими в освоєнні і застосуванні;
5. економічно доцільними.
Засоби проектування ЭИС можна розділити на два типа: без використання ЕОМ і з використанням ЕОМ.
Засоби проектування без використання ЕОМ застосовуються на всіх стадіях і етапах проектування ЭИС. Як правило, це засоби організаційно-методичного забезпечення операцій проектування і в першу чергу різні стандарти, проектування систем, що регламентують процес. Сюди ж відносяться єдина система класифікації і кодування інформації, уніфікована система документації, моделі описи і аналізу потоків інформації і тому подібне
Засоби проектування з використанням ЕОМ можуть застосовуватися як на окремих, так і на всіх стадіях і етапах процесу проектування ЭИС і відповідно підтримують раз-робітку елементів проекту системи, розділів проекту системи, проекту системи в цілому. Усю безліч засобів проектування з використанням ЕОМ ділять на чотири підкласи.
До першого підкласу відносяться операційні засоби, які підтримують проектування операцій засоби інформації. До цього підкласу засобів відносяться алгоритмічні мови, бібліотеки стандартних підпрограм і класів об'єктів, макрогенератори, генератори програм типових операцій обробки даних і тому подібне, а також засоби розширення функцій операційних систем (утиліти). У цей клас включаються також такі прості інструментальні засоби проектування, як засоби для тестування і от-ладки програм, підтримки процесу документування проекта і тому подібне. Особливість останніх програм полягає в тому, що з їх допомогою підвищується продуктивність праці проектувальників, але не розробляється закінчене проектне рішення.
Таким чином, засоби цього підкласу підтримують окремі операції проектування ЭИС і можуть застосовуватися незалежно один від одного.
До другого підкласу відносять засоби, що підтримують проектування окремих компонентів проекту ЭИС. До цього підкласу відносяться засоби загальносистемного призначення:
• системи управління базами даними (СУБД);
• методоорієнтіровані пакети прикладних програм (рішення завдань дискретного програмування, математичної статистики і тому подібне);
• табличні процесори;
• статистичні ППП;
• оболонки експертних систем;
• графічні редактори;
• текстові редактори;
• інтегровані ППП (інтерактивне середовище зі вбудованими діалоговими можливостями, що дозволяє інтегрувати вище перелічені програмні засоби).
Для перерахованих засобів проектування характерне їх використання для розробки технологічних підсистем ЭИС : введення інформації, організації зберігання і доступу до даних, обчислень, аналізу і відображення даних, прийняття рішень.
До третього підкласу відносяться засоби, що підтримують проектування розділів проекту ЭИС. У цьому підкласі виділяють функціональні кошти проектування.
Функціональні засоби спрямовані на розробку автоматизованих систем, що реалізовують функції, комплекси завдань і завдання управління. Різноманітність предметних областей породжує різноманіття засобів цього підкласу, орієнтованих на тип організаційної системи (промислова, непромислова сфери), рівень управління (наприклад, підприємство, цех, відділ, ділянка, робоче місце), функцію управління (планерування, облік і тому подібне).
До функціональних засобів проектування систем обробки інформації відносяться типові проектні рішення, функціональні пакети прикладних програм, типові проекти.
До четвертого підкласу засобів проектування ЭИС відносяться засоби, що підтримують розробку проекту на стадіях і етапах процесу проектування. До цього класу відноситься підклас засобів автоматизації проектування ЭИС (CASE - засоби).Сучасні CASE - засоби., у свою чергу, класифікуються в основному за двома ознаками:
1) по охоплюваних етапах процесу розробки ЭИС;
2) по мірі інтегрованості : окремі локальні засоби (tools), набір не інтегрованих засобів, що охоплюють більшість етапів розробки ЭИС (toolkit) і повністю інтегровані засоби, пов'язані загальною базою проектних даних - репозиторієм (workbench).
2. Поняття і основні системи кодування економічної інформації
Кодування - це процес привласнення умовних позначень об'єктам і класифікаційним групам по відповідній системі кодування.
Система кодування - це сукупність правил позначення об'єктів і угрупувань з використанням кодів. Код - це умовне позначення об'єктів або угрупувань у вигляді знаку або групи знаків відповідно до прийнятої системи. Код базується на визначеному алфавіті (деяка безліч знаків). Число знаків цієї великої кількості називається основою коду. Розрізняють наступні типи алфавітів : цифровий, буквений і змішаний.
Усі системи кодування можна згрупувати в два підмножини (рис.4.4) : реєстраційні і класифікаційні системи кодування.
Особливістю реєстраційних систем кодування являється їх незалежність від вживаних систем класифікації. Реєстраційні коди використовуються для ідентифікації об'єктів і передачі інформації про об'єкти на відстань, тому вони повинні задовольняти наступним вимогам: мінімальності довжини коду, однозначності відповідності найменування об’єкта і його кода впродовж тривалого періоду часу і захищеності коду від перешкод і помилок.
Рис 1. Схема класифікації систем кодування.
Реєстраційні коди складаються з двох частин: інформаційною і контрольною, призначеною для захисту передаваної інформації від помилок.
До реєстраційних систем відноситься порядкова і серійна системи кодування.
Порядкова система - це найбільш проста по своїй побудові система кодування, суть використання якої полягає в послідовному привласненні кожному об'єкту кодованої безлічі номера його порядку, тобто в привласненні цифр натурального ряду в порядку розташування об'єктів. Цей порядок може бути випадковим або визначатися потім попереднім угрупуванням об'єктів, наприклад за абеткою.
Як правило, порядкову систему застосовують для кодування малозначних, сталої і простої безлічі об'єктів, що не вимагають попередньої класифікації.
Серійна (серійно-порядкова) система кодування відрізняється від порядкової тим, що номенклатура кодованих об'єктів заздалегідь має бути розбита на угрупування за одною ознакою, і кожним угрупуванням має бути відведена серія кодових позначень, в межах якої кожному елементу привласнюється свій код по порядку. Серія позначень для кожного угрупування визначається так, щоб після привласнення кодів елементам цієї групи в ній залишалися б ще вільні номери на випадок появи нових об'єктів.
Класифікаційні коди використовують для віддзеркалення класифікаційних взаємозв'язків об'єктів і угрупувань і застосовуються в основному для складної логічної обробки економічної інформації на ЕОМ, звідси витікають вимоги: однозначності відображення класифікаційних взаємозв'язків об'єктів і їх угрупувань і забезпечення максимальної простоти програмування. Групу класифікаційних систем кодування можна розділити на дві підгрупи залежно від того, яка система класифікації використовують для впорядкування об'єктів.
Послідовні системи кодування характеризуються тим, що вони базуються на попередній класифікації за ієрархічною системою класифікації, в результаті використання якої коди нижче стоячих угрупувань утворюються шляхом додавання кодів до код вищестоящих угрупувань.
Паралельні системи кодування характеризуються тим, що вони будуються на основі використання фасетної системи класифікації і коди угрупувань після фасетів формуються незалежно один від одного.
Послідовні і паралельні системи кодування будуються на базі розрядної або комбінованої системи кодування.
Розрядна система застосовується для кодування об'єктів, визначуваних декількома супідрядними ознаками, використовуваними для вирішення економічних завдань. Кодовані об'єкти систематизуються за класифікаційними ознаками на кожному ступені класифікації, кожній ознаці відводиться певне число розрядів, в межах яких кодування угрупувань починається з одиниці. При розрядній системі кодування має місце так зване «залежне» кодування. Це означає, що класифікаційні угрупування за молодшими ознаками кодуються залежно від коду угрупування, утвореного за старшою ознакою. Запас вільних позицій визначається структурою коду.
Код об'єкту, побудований по цій системі, складається з такого числа позицій (чи числа груп розрядів), скільки було враховано ознак для об'єктів, тому розрядна система кодування називається іноді позиційною системою. Конкретне значення ознаки, що характеризує об'єкт, визначається позицією і значенням певного числа в структурі коду. Довжина коду зави-сит від числа східців класифікації, від числа класифікаційних угрупувань на кожному ступені і від основи кодування.
Комбінована система кодування, володіючи усіма перевагами розрядного коду, застосовується для кодування великих номенклатур (переліків) об'єктів, які характеризуються багатьма супідрядними або незалежними ознака-мі. Ця система базується на поєднанні принципів побудови таких систем кодування, як розрядна, серійна, порядкова і кода повторення.
Код повторення (мнемокод) - це буквені або буквено-цифрові коди, які характеризуються тим, що в структуру коду переносять частину символьних позначень об'єктів з метою підвищення мнемонічності коду або для скорочення його довжини.
Вибір конкретної системи кодування залежить від об'єму кодованої номенклатури, її стабільності, від завдань, що стоять перед системою, і від показників ефективності обробки інформації при використанні якої-небудь системи.
3. Проектування процесу введення паперових документів
Одним з основних завдань, пов'язаних із скороченням витрат на обробку даних, є автоматизація масового введення паперових первинних документів, завантаження даних в інформаційну базу. Основна відмінність масового введення документів від простого сканування полягає в тому, що обробляється велика кількість однотипних документів. В якості прикладів додатків цієї технології в конкретних предметних областях можна привести систему введення і обробки «Платіжних доручень» у банку, систему введення «Податкових декларацій», систему введення і перевірки бухгалтерських документів в пенсійному фонді.
Для організації обробки великої кількості паперових документів і перекладу їх в електронну форму необхідно розробити систему масового введення документів (СМВ), яка буде здатна працювати як з одним, так і з декількома тисячами паперових документів в день. При проектуванні системи введення паперових документів виконується наступна сукупності операцій:
визначення складу операцій, яка повинна виконувати система;
вибирання технічних засобів реалізації виконання цих операцій;
вибір і налаштування програмного забезпечення;
розробка технологічної документації.
Розглянемо зміст основних операцій автоматизованого введення паперових документів. Автоматизовані читання і введення документів включають операції, які можна об'єднати в декілька стадій :
підготовка документів до сканування;
отримання зображення документу;
розпізнавання і введення даних, що містяться в документі вИБ.
1. Підготовка документів до сканування - дуже важлива фаза процесу введення документів, яка забезпечує отримання достовірних від сканованих зображень, що зберігаються в системі, і включає дві операції: безпосередню підготовку документів для сканування і виконання опису на будівництва системи на конкретну форму документу.
Підготовка документів для сканування припускає виконання наступних кроків :
•визначення самого документу для сканування;
•вибір конкретних областей документу для сканування;
•визначення технологічного ланцюжка руху документу до сканування;
•безпосередня підготовка документів для сканування: відкриття конвертів, видалення скріпок або інших предметів, що заважають скануванню;
•підготовка пакетів документів для сканування. Складання опису кожного документу припускає виконання трьох операцій :
•складання налаштування форми документу;
•налаштування моделі введення;
•налаштування полів форми документу і індексації бази даних.
У основі виконання цього складу операцій лежить поняття форматованого (структурованого) документу (ФД). Типовими прикладами документів, що форматуються є «Платіжні доручення», «Прайс-листи» «Декларації про прибутки», «Рахунки» і так далі. Основною структурною одиницею документу, що форматується, є поле документу. Кожне поле описується в двох аспектах: візуально, зокрема геометрично, і містячи тільний. З образотворчої точки зору кожне поле має бути явно відособлене: порожніми проміжками, розділовими лініями, оригінальним типом шрифту, рівнем фону, кольором і так далі
Змістовна частина характеризується призначенням поля, словарним і алфавітним складом, а також деякими законами побудови тексту, наприклад, в полі поштової адреси повинні бути зведення про місто, вулицю, будинок
Геометричні і змістовні характеристики полів можуть бути як абсолютно незалежними, так і взаємосвязаними. Наприклад, в прибутковому ордері поряд з полями «кількість» і «ціна» знаходиться поле «сума».
Документи, які підлягають скануванню, можуть бути об'єднані в групи за декількома ознаками. За способом нанесення інформації можна виділити документи, в яких використовуються мітки, друкарський, рукописний текст. Так, наприклад, виборчі бюлетені використовують міточний спосіб, тоді як Прайс-листи - друкарський, а первинні бухгалтерські документи - в основному рукописні.
По геометричній варіантності полів розрізняють документи, в яких розташування усіх полів і записів строго фіксірованні відносно опорних елементів : рамок, ліній, постоялих надрукованих записів, спеціальних маркерів. Усе спеціально підготовлені для машинної обробки документи мають цю якість. Іншим типом є документи, які мають довільне розташування полів.
Крім того, можна розділяти документи по наявності явних роздільників полів, які часто є присутніми в таблицях, бухгалтерських документах і в платіжних дорученнях, або їх відсутності.
2. Напів паперове зображення документу - включає виконання таких операцій, як сканування; контроль якості відображень, що сканують, і можливе повторне сканування.
Сканування - це дуже відповідальна операція, отже, до вибору конкретної моделі сканера необхідно підходити досить відповідально. При виборі слід враховувати наступні чинники: розміри документів, їх стан, також чи є документ одностороннім або двостороннім, щільність роботи сканерів, необхідний дозвіл зображення, надійність отримуваних зображень.
•персональні - низько швидкісні (20-40 рядків/мін.
•настільні офісні - середньо швидкі (40-60 рядків/мін або 80-120 зображень в хвилину.
•високопродуктивні потокові (90-185 сторінок/мін або 180-370 зображень в хвилину.
За якістю сканування, залежного від дозволенної здібності, їх можна розділити на наступні групи:
•з низькою роздільною здатністю дюйм);
•з середньою роздільною здатністю (600-800 точок/1 дюйм);
• з високою роздільною здатністю (1600-2800 точок/ дюйм);
• спеціального призначення.
Для введення старих документів застосовують сканери спеціального призначення з вакуумним притиском документів, які пред'являють дуже низькі вимоги до документу і обробляють його в щадному режимі. Такі сканери дозволяють сканувати не повністю розкриті книги і документи поганої якості. Швидкість введення у таких пристроїв 0,25-3 сторінки в (хвилину.
Контроль якості від сканованих зображень потрібний для того, щоб усі потрібні документи були від скановані і легко читані (не повинно бути пропущених сторінок, неякісних зображень і так далі). Для підвищення ефективності і надійності системи слід мати можливість вибіркової перевірки якості від сканованих зображень, а при скануванні багатосторінкових документів - можливість відстежувати порядок сканованих сторінок.
Повторне сканування проводиться у разі незадовільного якості зображення або через проблеми, пов'язані з неправильним порядком сторінок в документі.
3.
Розпізнавання і введення даних, що містяться в документі, в інформаційну базу припускають виконання наступних основних операцій :
• попередньої обробки зображень;
• знаходження полів (сегментація документу і читання тексту);
• перевірки розпізнаної інформації;
• введення даних в інформаційну базу.
• Попередня обробка зображення документів використовує наступні спеціальні функції:
• очищення зображення застосовується для зняття з зображення окремих елементів (наприклад, точки, плями);
• зняття фону і виділень (наприклад, з цінних паперів);
• вирівнювання зображення для наступної його обробки з метою поліпшення якості розпізнавання, щоб документ показати в строго вертикальному положенні в процедурі розпізнання без перекосів;
• зняття елементів форм (для того, щоб ефективно обробляти форму, необхідно видаляти із зображення елементи форми: лінії, розграфлені, таблиці і так далі);
• визначення ідентифікатора форм (оскільки доводиться вводить в систему найрізноманітніші форми, відмінні як за змістом, так і по структурі; для того, щоб система могла працювати з множиною форм, вона повинна визначати, яка форма поступила на обробку, і завантажувати відповідно заздалегідь налагоджене і підготовлене опис форми);
• відновлення букв і символів, якщо вони виявляються пересіченими елементами форми, наприклад лінією.
Крім того, до попередньої обробки зображення відносяться наступні функції, що підвищують надійність розпізнавання:
• обертання зображення на довільний кут;
• масштабування зображення;
• регулювання рівня сірого кольору;
• компресія і декомпресія зображення.
Процеси знаходження полів (сегментація документу) і читання тексту можуть бути виконані послідовно і незалежно, якщо поля повністю визначені своїми візуальними характеристиками. Така ситуація характерна для машиночитаємих форм і документів з явними роздільниками полів у вигляді ліній або великих проміжків. У документах, що не мають строго певного положення полів і явних роздільників між ними, немає принципово іншого способу, як прочитати текст і за його змістом скоректувати результати попередньої сегментації.
У машиночитаємих формах завдання в основному зводиться до знаходження опорних елементів і обчислення відносно них положення інформативних полів. Документи, строго заданої геометрії, що не мають, але що проте використовують явно задані роздільники, обробляються досить надійно, на приклад таблиці з роздільниками у вигляді горизонтальних та вертикальних прямих.
Найбільш складна ситуація виникає при роботі з гнучкими формами документів. Термін «гнучка» означає, що відомі склад полів, їх зразкове розташування, деякі особливості по будові полів, але відсутня повна і точна орієнтація по їх розташуванню.
Як правило, завдання обробки різних форм документів, таких, як платіжні документи, податкові декларації і інші, вирішуються індивідуально шляхом програмування з використанням загальних прийомів.
Якщо дані після розпізнавання помічені як некоректні, то вони автоматично прямують на ручне редагування. Під час редагування оператор бачить реальне зображення нерозпізнаного поля і має можливість від коректувати його. Після введення оператором нових даних знову застосовуються правила перевірки даних, тобто на усіх етапах в ведення, як автоматичного, так і ручного, здійснюється перевірка даних відповідно до правил, визначених користувачем. Великі вимоги в даному випадку пред'являються до методів перевірки даних, що вводяться. Для підвищення надійності даних використовуються додаткові механізми, такі, як застосування словників і таблиць, визначуваних користувачем. Як правило, системи включають спеціальні вбудовані засоби для визначення спеціальних процедур перевірки для кожного поля документу.
Введення даних, що містяться в документі, в інформаційну базу є завершальною операцією. При цьому може бути збережене зображення документу.
На відміну від звичайної системи розпізнавання (OCR) система введення стандартних форм використовує формальний опис початкової форми документу або бланка. Це дозволяє автоматично поміщати розпізнану інформацію в поля бази даних без участі оператора. Суворе дотримання стандартного виду форми документа істотно підвищує точність розпізнання полів документу.
Основний чинник при оцінці ефективності систем розпізнавання полягає у вартості виправлення помилок при розпізнавані, а не в точності і швидкості системи. У деяких випадках витрати на виправлення помилок при розпізнаванні можуть перекрити усі плюси автоматизації і зробити ручне введення по зображенню ефективнішим.
При розробці і використанні такої системи проектувальник вимагається виконати також великий об'єм робіт по інтеграції цієї системи введення в діючу або що розробляє інформаційну систему. На продуктивність системи дуже великий вплив чинить використовувана технологія вода так, її налаштування на поточне завдання і вид документів. Тут потрібно враховувати склад устаткування, програмне забезпечення і сумісність формату розпізнаної інформації вже що існують системами.
Існує безліч компаній, які пропонують рішення або компоненти систем обробки форм. Рішення про в системи обробки форм, а також вибір того або іншого додатки повинні робитися з обліком в першу чергу таких вимог:
•тип оброблюваних документів і вид що містяться в них даних;
•точність розпізнавання;
•наявність ефективної системи редагування;
•настроювання системи до вимог конкретного користувача і здатність змінюватися згідно зовнішніх чинників, що міняються, даним умовам без програмування;
•наявність підтримки сканерів різних типів, а також різного роду плат обробки зображень документів;
•наявність редактора форм, що налаштовує систему на нові форми або зміни старої форми, на яку система була заздалегідь орієнтована;
•наявність редактора схем обробки документів, відкритого інтерфейсу підключення різних модулів розпізнавання (залежно від типу форми можна для підвищення якості розпізнавання підключати той або інший модуль, котрі найбільш підходить для цього типу форми);
•наявність редактора схем експорту у базу даних (дані, котрі витягаються при обробці форми, мають бути, передані у базу даних для зберігання або в інші бізнес-додатки для обробки).
Ефективність застосування системи введення паперових документів в ЭИС заснована в першу чергу на значному зменшення участі людини у введенні даних. Як наслідок, можна спостерігати зменшення часу введення документів і кількості помилок. Для організацій, оброблювальних великі потоки форм (центральні податкові і поштові відомства, статистичні організації, центри авторизації за розрахунками за кредитні карти), використання описаних технологій позволить вирішити проблеми ефективності обробки сотень тисяч і навіть мільйонів форм в стислі терміни.
проектування економічний кодування інформація сканування документ
Список використаної літератури
1. «Проэктирование экономических информационных систем». Підручник. Г.Н. Смирнова, А.А. Сорокін, Ю.Ф. Тельнов. 2002 р.
2. «Інформаційні системи і технології в економіці». Посібник. За ред. В.С. Пономаренка. ВЦ «Академія». 2002 р.
Размещено на Allbest.ru
• попередньої обробки зображень;
• знаходження полів (сегментація документу і читання тексту);
• перевірки розпізнаної інформації;
• введення даних в інформаційну базу.
• Попередня обробка зображення документів використовує наступні спеціальні функції:
• очищення зображення застосовується для зняття з зображення окремих елементів (наприклад, точки, плями);
• зняття фону і виділень (наприклад, з цінних паперів);
• вирівнювання зображення для наступної його обробки з метою поліпшення якості розпізнавання, щоб документ показати в строго вертикальному положенні в процедурі розпізнання без перекосів;
• зняття елементів форм (для того, щоб ефективно обробляти форму, необхідно видаляти із зображення елементи форми: лінії, розграфлені, таблиці і так далі);
• визначення ідентифікатора форм (оскільки доводиться вводить в систему найрізноманітніші форми, відмінні як за змістом, так і по структурі; для того, щоб система могла працювати з множиною форм, вона повинна визначати, яка форма поступила на обробку, і завантажувати відповідно заздалегідь налагоджене і підготовлене опис форми);
• відновлення букв і символів, якщо вони виявляються пересіченими елементами форми, наприклад лінією.
Крім того, до попередньої обробки зображення відносяться наступні функції, що підвищують надійність розпізнавання:
• обертання зображення на довільний кут;
• масштабування зображення;
• регулювання рівня сірого кольору;
• компресія і декомпресія зображення.
Процеси знаходження полів (сегментація документу) і читання тексту можуть бути виконані послідовно і незалежно, якщо поля повністю визначені своїми візуальними характеристиками. Така ситуація характерна для машиночитаємих форм і документів з явними роздільниками полів у вигляді ліній або великих проміжків. У документах, що не мають строго певного положення полів і явних роздільників між ними, немає принципово іншого способу, як прочитати текст і за його змістом скоректувати результати попередньої сегментації.
У машиночитаємих формах завдання в основному зводиться до знаходження опорних елементів і обчислення відносно них положення інформативних полів. Документи, строго заданої геометрії, що не мають, але що проте використовують явно задані роздільники, обробляються досить надійно, на приклад таблиці з роздільниками у вигляді горизонтальних та вертикальних прямих.
Найбільш складна ситуація виникає при роботі з гнучкими формами документів. Термін «гнучка» означає, що відомі склад полів, їх зразкове розташування, деякі особливості по будові полів, але відсутня повна і точна орієнтація по їх розташуванню.
Як правило, завдання обробки різних форм документів, таких, як платіжні документи, податкові декларації і інші, вирішуються індивідуально шляхом програмування з використанням загальних прийомів.
Якщо дані після розпізнавання помічені як некоректні, то вони автоматично прямують на ручне редагування. Під час редагування оператор бачить реальне зображення нерозпізнаного поля і має можливість від коректувати його. Після введення оператором нових даних знову застосовуються правила перевірки даних, тобто на усіх етапах в ведення, як автоматичного, так і ручного, здійснюється перевірка даних відповідно до правил, визначених користувачем. Великі вимоги в даному випадку пред'являються до методів перевірки даних, що вводяться. Для підвищення надійності даних використовуються додаткові механізми, такі, як застосування словників і таблиць, визначуваних користувачем. Як правило, системи включають спеціальні вбудовані засоби для визначення спеціальних процедур перевірки для кожного поля документу.
Введення даних, що містяться в документі, в інформаційну базу є завершальною операцією. При цьому може бути збережене зображення документу.
На відміну від звичайної системи розпізнавання (OCR) система введення стандартних форм використовує формальний опис початкової форми документу або бланка. Це дозволяє автоматично поміщати розпізнану інформацію в поля бази даних без участі оператора. Суворе дотримання стандартного виду форми документа істотно підвищує точність розпізнання полів документу.
Основний чинник при оцінці ефективності систем розпізнавання полягає у вартості виправлення помилок при розпізнавані, а не в точності і швидкості системи. У деяких випадках витрати на виправлення помилок при розпізнаванні можуть перекрити усі плюси автоматизації і зробити ручне введення по зображенню ефективнішим.
При розробці і використанні такої системи проектувальник вимагається виконати також великий об'єм робіт по інтеграції цієї системи введення в діючу або що розробляє інформаційну систему. На продуктивність системи дуже великий вплив чинить використовувана технологія вода так, її налаштування на поточне завдання і вид документів. Тут потрібно враховувати склад устаткування, програмне забезпечення і сумісність формату розпізнаної інформації вже що існують системами.
Існує безліч компаній, які пропонують рішення або компоненти систем обробки форм. Рішення про в системи обробки форм, а також вибір того або іншого додатки повинні робитися з обліком в першу чергу таких вимог:
•тип оброблюваних документів і вид що містяться в них даних;
•точність розпізнавання;
•наявність ефективної системи редагування;
•настроювання системи до вимог конкретного користувача і здатність змінюватися згідно зовнішніх чинників, що міняються, даним умовам без програмування;
•наявність підтримки сканерів різних типів, а також різного роду плат обробки зображень документів;
•наявність редактора форм, що налаштовує систему на нові форми або зміни старої форми, на яку система була заздалегідь орієнтована;
•наявність редактора схем обробки документів, відкритого інтерфейсу підключення різних модулів розпізнавання (залежно від типу форми можна для підвищення якості розпізнавання підключати той або інший модуль, котрі найбільш підходить для цього типу форми);
•наявність редактора схем експорту у базу даних (дані, котрі витягаються при обробці форми, мають бути, передані у базу даних для зберігання або в інші бізнес-додатки для обробки).
Ефективність застосування системи введення паперових документів в ЭИС заснована в першу чергу на значному зменшення участі людини у введенні даних. Як наслідок, можна спостерігати зменшення часу введення документів і кількості помилок. Для організацій, оброблювальних великі потоки форм (центральні податкові і поштові відомства, статистичні організації, центри авторизації за розрахунками за кредитні карти), використання описаних технологій позволить вирішити проблеми ефективності обробки сотень тисяч і навіть мільйонів форм в стислі терміни.
проектування економічний кодування інформація сканування документ
Список використаної літератури
1. «Проэктирование экономических информационных систем». Підручник. Г.Н. Смирнова, А.А. Сорокін, Ю.Ф. Тельнов. 2002 р.
2. «Інформаційні системи і технології в економіці». Посібник. За ред. В.С. Пономаренка. ВЦ «Академія». 2002 р.
Размещено на Allbest.ru