Beth yw Cydnabod Cymeriad Optegol (OCR)?

Mae Cydnabod Cymeriad Optegol (OCR) yn cyfeirio at feddalwedd sy'n creu fersiwn ddigidol o ddogfen argraffedig, teipiedig neu lawysgrifen y gall cyfrifiaduron ei ddarllen heb yr angen i deipio'n llaw neu fynd i'r testun. Yn gyffredinol, defnyddir OCR ar ddogfennau wedi'u sganio ar ffurf PDF , ond gallant hefyd greu fersiwn o ddarllenadwy o gyfrifiadur o fewn ffeil delwedd.

Beth yw OCR?

OCR, a elwir hefyd yn gydnabyddiaeth testun, yw technoleg meddalwedd sy'n trawsnewid cymeriadau fel rhifau, llythyrau a atalnodi (a elwir hefyd yn glyffs) o ddogfennau printiedig neu ysgrifenedig i mewn i ffurflen electronig yn haws i'w gydnabod a'u darllen gan gyfrifiaduron a rhaglenni meddalwedd eraill. Mae rhai rhaglenni OCR yn gwneud hyn fel dogfen yn cael ei sganio neu ei ffotograffio gyda chamera digidol ac mae eraill yn gallu cymhwyso'r broses hon at ddogfennau a gafodd eu sganio neu eu tynnu o'r blaen heb OCR. Mae OCR yn caniatáu i ddefnyddwyr chwilio o fewn dogfennau PDF, golygu testun, ac ail-lunio dogfennau.

Beth yw OCR Used For?

Ar gyfer anghenion sganio bob dydd, efallai na fydd OCR yn fargen fawr. Os ydych chi'n gwneud llawer o sganio, gallwch allu chwilio o fewn PDFs i ddod o hyd i'r union un sydd ei angen arnoch, gall arbed ychydig o amser a gwneud yn fwy pwysig i ymarferoldeb OCR yn eich rhaglen sganiwr. Dyma rai pethau eraill OCR yn helpu gyda:

Pam Defnyddiwch OCR?

Beth am gymryd llun yn unig, dde? Oherwydd na fyddech yn gallu golygu unrhyw beth neu chwilio'r testun gan mai dim ond delwedd fyddai. Gall sganio'r ddogfen a rhedeg meddalwedd OCR droi'r ffeil honno i mewn i rywbeth y gallwch ei olygu a gallu ei chwilio.

Hanes OCR

Er bod y defnydd cynharaf o gydnabyddiaeth testun yn dyddio hyd 1914, dechreuodd y datblygiadau a'r defnydd eang o dechnolegau OCR yn ddifrifol yn y 1950au, yn benodol gyda chreu ffontiau symlach iawn a oedd yn haws eu trosi i destun sy'n ddarllenadwy yn ddigidol. Crëwyd y cyntaf o'r ffontiau symlach hyn gan David Shepard ac a elwir yn aml yn OCR-7B. Mae OCR-7B yn dal i gael ei ddefnyddio heddiw yn y diwydiant ariannol ar gyfer y ffont safonol a ddefnyddir ar gardiau credyd a chardiau debyd. Yn y 1960au, dechreuodd gwasanaethau post mewn sawl gwlad ddefnyddio technoleg OCR i gyflymu'r broses o ddosbarthu post yn helaeth, gan gynnwys yr Unol Daleithiau, Prydain Fawr, Canada a'r Almaen. OCR yw'r dechnoleg craidd o hyd i ddosbarthu post ar gyfer gwasanaethau post ledled y byd. Yn 2000, defnyddiwyd gwybodaeth allweddol o derfynau a galluoedd technoleg OCR i ddatblygu'r rhaglenni CAPTCHA a ddefnyddir i atal bots a sbamwyr.

Dros y degawdau, mae OCR wedi tyfu'n fwy cywir ac yn fwy soffistigedig oherwydd datblygiadau mewn meysydd technoleg cysylltiedig megis deallusrwydd artiffisial , dysgu peiriannau a gweledigaeth gyfrifiadurol. Heddiw, mae meddalwedd OCR yn defnyddio cydnabyddiaeth patrwm, darganfod nodweddion a mwyngloddio testun i drawsnewid dogfennau yn gyflymach ac yn fwy cywir nag erioed o'r blaen.