คนไทยพัฒนาโปรแกรมแปลงเอกสารและรูปภาพเป็นข้อความ

อาจารย์คณะวิศวฯ จุฬาฯ นำเทคโนโลยี AI Deep Tech พัฒนาโปรแกรมสแกนเอกสารและรูปภาพเป็นข้อความ (OCR) อ่านภาษาไทยแม่นยำกว่า 90% UTC จุฬาฯ พร้อม spin-off สู่ตลาดในนามบริษัท Eikonnex AI จำกัด หลายคนที่ทำงานด้านข้อมูลที่มีการใช้เอกสารกระดาษ เช่น การทำแบบสอบ ถาม งานวิจัย ฯลฯ คงจะรู้ดีว่างานยากและจำเจจริงๆ อยู่ที่ตอนได้รับกระดาษพร้อมคำตอบหรือข้อมูลกลับมาแล้ว ต้องมาพิมพ์ข้อความจากกระดาษทีละแผ่นๆ เพื่อจัดเก็บข้อมูลเป็นไฟล์ดิจิทัล เป็นงานที่ใช้เวลามาก แถมทำให้สายตาล้า ออฟฟิศซินโดรมถามหาอีกต่างหาก

รองศาสตราจารย์ ดร.ธนารัตน์ ชลิดาพงศ์ อาจารย์จากภาควิชาวิศวกรรมคอมพิวเตอร์ คณะวิศวกรรมศาสตร์ จุฬาลงกรณ์มหาวิทยาลัย สามารถทดแทนด้วยแนวคิดปัญญาประดิษฐ์ (AI: Artificial Intelligence) อาจารย์ธนารัตน์จึงนำทีมนิสิตปริญญาเอก ดร.ธนานพ กอบชัยสวัสดิ์ ร่วมพัฒนา “ReadMe” โปรแกรมประเภท OCR (Optical Character Recognition) เพื่อช่วยสแกนข้อความทั้งภาษาไทยและภาษาอังกฤษที่อยู่บนเอกสาร รูปภาพ หรือไฟล์วีดิโอให้ออกมาเป็นตัวหนังสือดิจิทัลได้ทันที

OCR คืออะไร

เทคโนโลยี OCR หรือ Optical Character Recognition คือ โปรแกรมที่ใช้สแกนตัวหนังสือจากภาพ หรือวีดิโอ ให้กลายเป็นตัวหนังสือแบบดิจิทัล เพื่อนำข้อมูลมาวิเคราะห์ผล พร้อมนำไปประยุกต์ใช้งานได้ทันที ซึ่งรูปภาพที่นำมาใช้สแกนนั้นเป็นได้ 2 ลักษณะ คือ รูปภาพทั่วไป และรูปภาพที่เป็นเอกสาร เทคโนโลยี OCR ประยุกต์ใช้ได้หลากหลายรูปแบบ เช่น การอ่านรหัสไปรษณีย์บนซองจดหมาย เพื่อคัดแยกซองจดหมายได้โดยอัตโนมัติ การอ่านหมายเลขบนแคร่รถไฟ เพื่อให้สามารถทราบตำแหน่งของตู้รถไฟว่าอยู่จุดไหนเวลาใดได้ทันทีสามารถใช้กับกล้องติดหน้ารถยนต์เพื่อช่วยอ่านป้ายจราจรและป้ายบอกทาง หรือช่วยอ่านป้ายต่างๆ ให้ผู้มีสายตาเลือนรางเป็นต้น

“OCR ถือเป็นนวัตกรรมที่ใช้ปัญญาประดิษฐ์ช่วยลดการใช้แรงงานมนุษย์ ประหยัดเวลา ทำให้ชีวิตประจำวันของคนเรามีความสะดวกและง่ายขึ้นมากเลยทีเดียว” รศ.ดร.ธนารัตน์ กล่าว

ReadMe อ่านไทยคล่องแบบเจ้าของภาษา

เทคโนโลยี OCR ได้รับการพัฒนามาอย่างต่อเนื่องจนมีความแม่นยำสูงขึ้นกว่าก่อนมาก แต่ก็ยังคงมีจุดอ่อนที่เป็นอุปสรรคต่อการใช้งานสำหรับคนไทย ซึ่งก็คือการอ่าน “ภาษาไทย” นั่นเอง

“ไวยากรณ์และโครงสร้างของภาษาอังกฤษจะง่ายต่อคอมพิวเตอร์ในการอ่าน แต่ภาษาไทยยากกว่ามาก เพราะตัวอักขระเยอะ มีสระ มีวรรณยุกต์ ในหนึ่งบรรทัดมีตัวอักษรได้ถึง 4 ระดับ ในขณะที่ภาษาอังกฤษมีเพียงระดับเดียว” รศ.ดร.ธนารัตน์อธิบาย ปัญหาดังกล่าวกลายเป็นอดีตไปแล้ว เมื่อเทคโนโลยีการเรียนรู้เชิงลึก เข้ามามีบทบาทช่วยให้ AI ฉลาดมากขึ้น”

“เมื่อนำเทคโนโลยีใหม่มารวมกับโจทย์เดิม ก็ช่วยเพิ่มความแม่นยำให้เทคโนโลยี OCR อ่านภาษาไทยได้เก่งเหมือนมีคนไทยมาอ่านเอง”

“งานของภาคธุรกิจส่วนใหญ่เป็นงานเอกสาร ปัจจุบันยังใช้คนในการกรอกข้อมูลอยู่ เสียแรงและเวลามาก เราจึงพัฒนาโปรแกรม ReadMe เพื่อตอบโจทย์ธุรกิจ โดยเน้นที่การอ่านเอกสารให้แม่นยำ และเกิดข้อผิดพลาดให้น้อยที่สุด” รศ.ดร.ธนารัตน์ กล่าว

องค์กรที่นำ ReadMe ไปใช้ในระบบแล้ว พบว่า เมื่อเทียบกับ OCR ของบริษัทอื่นๆ ทั้งของไทยและต่างประเทศ ReadMe มีความแม่นยำมากที่สุดถึง 92.6% ช่วยลดความผิดพลาดของมนุษย์ได้มาก (human error)”

ปัจจุบัน บริษัท Eikonnex AI จำกัด ให้บริการ ReadMe ทั้งในรูปแบบของการเข้าไปช่วยพัฒนาโปรแกรมหรือแอปพลิเคชันเพื่อธุรกิจนั้นๆ หรือต้องการซื้อตัวโปรแกรมไปใช้กับแอปพลิเคชันขององค์กรเองก็สามารถทำได้เช่นกัน

ผู้สนใจผลิตภัณฑ์ ReadMe สามารถดูรายละเอียดเพิ่มเติมได้ทางเว็บไซต์ https://www.eikonnex.ai/ และเข้าไปทดลองใช้ ReadMe เวอร์ชันทดลองได้ที่ https://readme.eikonnex.ai/

คนไทยพัฒนาโปรแกรมแปลงเอกสารและรูปภาพเป็นข้อความ

หน้าหลัก

Social Media

ข้อมูลองค์กร