Extragerea informațiilor din Imagini

Tehnicile de extragere a informațiilor pot fi utilizate pentru identificarea obiectelor sau clasificarea conținutului documentelor vizuale. Acest lucru este util în toate domeniile în care apar o mulțime de date vizuale nestructurate care trebuie procesate sau analizate în continuare.

Imagini, videouri, pdf

Chiar și în era transformării digitale, majoritatea informațiilor care sunt utilizate într-o afacere zi cu zi sunt și rămân imagini nestructurate. Acestea includ, de exemplu, imagini a produselor de la producători, dovezi a daunelor fizice pentru compania de asigurări, imagini din articole create de persoane care nu sunt verificate, video-uri din fața biroului de lucru după un furt. Prelucrarea acestor tipuri de date necesită o mare cantitate de efort manual și reprezintă un factor care determină costurile. Acest lucru înseamnă, în special, că orice îmbunătățire care face ca procesul să fie ceva mai eficient este deja foarte valoros.

Clasificarea imaginilor se concentrează pe gruparea unei imagini într-o categorie predefinită. Pentru a realiza acest lucru, trebuie să avem mai multe imagini cu etichete care ne interesează și să instruim un computer pentru a converti, în esență, numere de pixeli în etichete. Asta înseamnă doar că computerul vede o fotografie cu o pisică și spune că există o pisică în ea.

Detectarea obiectelor folosește un clasificator de imagini pentru a afla ce este prezent într-o imagine și unde. Aceste sarcini au fost ușurate prin utilizarea rețelelor neuronale convoluționale (CNN) care au permis detectarea mai multor clase într-o singură trecere a imaginii.

Detectarea și recunoașterea feței

Când ne gândim la o anumită persoană, de multe ori ne imaginăm chipul, zâmbetul și diferite trăsături faciale unice. Știm cum să recunoaștem persoana prin fața ei, să înțelegem emoțiile, să estimăm vârsta lui, aproape cu 100% certitudine putem spune sexul său. Sistemul de viziune umană poate face aceste lucruri și multe alte lucruri cu ușurință. Putem face același lucru cu algoritmii moderni de inteligență artificială, în special cu rețelele neuronale profunde!

Un sistem de regăsire a imaginilor este un sistem computerizat pentru navigarea, căutarea și preluarea imaginilor dintr-o bază de date mare de imagini digitale

Recunoașterea optică a caracterelor sau cititorul de caractere optice (OCR) este conversia electronică sau mecanică a imaginilor textului scris, scris sau imprimat în text codat de mașină, indiferent dacă este un document scanat, o fotografie a unui document, o scenă-fotografie (de exemplu textul cu semne și panouri publicitare într-o fotografie de peisaj) sau dintr-un text de subtitrare suprapus unei imagini (de exemplu dintr-o emisiune de televiziune).

SmartAItomation