คัมภีร์ล้านนา ทรงคุณค่าสู่โลกดิจิตอลภาควิชาวิทยาการคอมพิวเตอร์ คณะวิทยาศาสตร์ มช.

Lanna OCR Application เป็นหนึ่งในผลงานการออกแบบ Application ที่น่าสนใจ ของนักศึกษาระดับปริญญาเอก ภาควิชาวิทยาการคอมพิวเตอร์ คณะวิทยาศาสตร์ มหาวิทยาลัยเชียงใหม่ ด้วยการทำงานที่สร้างสรรค์ เพื่อนำแนวคิดและองค์ความรู้ที่ทันสมัยมาตอบโจทย์การศึกษาประวัติศาสตร์ยุคโบราณให้มีความสะดวกและแม่นยำยิ่งขึ้น เรียกได้ว่าเป็นการนำวิทยาการใหม่มาใช้เป็นเครื่องมือเรียนรู้โลกยุคเก่าได้อย่างลงตัว

และเบื้องหลังกว่าจะมาเป็น Application สุดทันสมัยนี้ นอกจากนักวิจัยจะต้องมีความรู้ความสามารถทางด้านวิทยาการคอมพิวเตอร์แล้ว นักวิจัยยังต้องใช้เวลาในการศึกษาภาษาล้านนานานนับปี เพื่อให้มีความรู้เข้าใจในลักษณะของภาษาที่ปรากฏบนคัมภีร์ใบลานที่เก็บรักษาไว้ในที่ต่างๆ อย่างถ่องแท้ จึงจะสามารถพัฒนามันสมองของคอมพิวเตอร์ให้สามารถเข้าใจและทำงานตอบสนองสิ่งที่นักวิจัยและนักประวัติศาสตร์ต้องการได้อย่างแม่นยำ

รศ.ดร.จีรยุทธ ไชยจารุวณิช อาจารย์ประจำภาควิชาวิทยาการคอมพิวเตอร์ คณะวิทยาศาสตร์ มหาวิทยาลัยเชียงใหม่ ที่ปรึกษาโครงการวิจัย กล่าวถึงที่มาของโครงการวิจัยนี้ว่า”เรามีโอกาสเข้ามามีส่วนร่วมกับโครงการนี้ โดยการนำเอาภาพ ทั้งไมโครฟิล์ม ทั้งภาพถ่ายดิจิตอล ของทั้งสถาบันวิจัยสังคม สำนักส่งเสริมศิลปวัฒนธรรม สำนักหอสมุด มหาวิทยาลัยเชียงใหม่ และสำนักอาคารเรือนเดิม คณะมนุษยศาสตร์ มหาวิทยาลัยเชียงใหม่ มาร่วมทำโครงการที่เชื่อมโยงฐานข้อมูลใบลาน ซึ่งทำให้เราเห็นภาพรวมของคอลเล็คชันใบลานที่เราได้มีการสำรวจและก็สะสมที่ผ่านมาจนถึงปัจจุบัน

ทั้งนี้ ในลำดับถัดไป เมื่อเราได้รวบรวมจัดทำเป็นฐานข้อมูลใบลานไว้แล้ว เราก็นำองค์ความรู้ที่ปรากฏอยู่ในใบลานมาใช้ประโยชน์ต่อสังคม ซึ่งเนื้อหาส่วนใหญ่ที่ปรากฏอยู่ในใบลานก็จะเกี่ยวข้องกับพุทธศาสนาเป็นหลัก มีจำนวนไม่น้อยที่เป็นภูมิปัญญาท้องถิ่น จะมีเรื่องของประวัติศาสตร์ วรรณกรรม กฎหมาย ตำรายา พิธีกรรมต่างๆ ที่ถูกบันทึกเอาไว้ ซึ่งก็จะเป็นประโยชน์สำหรับผู้ที่สนใจศึกษาเกี่ยวข้องกับเรื่องของประวัติศาสตร์ วัฒนธรรมของท้องถิ่นล้านนาของเรา ซึ่งในกระบวนการที่จะสามารถนำความรู้มาใช้ประโยชน์ได้ เราจำเป็นจะต้องทำให้เครื่องคอมพิวเตอร์สามารถเข้าใจถึงอักษรที่ถูกจารบนใบลาน (จาร = ใช้เหล็กแหลมเขียนลงบนใบลาน) จึงเป็นที่มาของโครงการวิจัยของนักศึกษาปริญญาเอก ภาควิชาวิทยาการคอมพิวเตอร์ คณะวิทยาศาสตร์ มหาวิทยาลัยเชียงใหม่ ที่ได้ทำการวิจัยในเรื่องของการสกัดตัวอักษรล้านนาที่ปรากฏอยู่บนใบลาน”

ด้านนายปภังกร อิ่นแก้ว นักศึกษาระดับปริญญาเอก ภาควิชาวิทยาการคอมพิวเตอร์ คณะวิทยาศาสตร์ มหาวิทยาลัยเชียงใหม่ นักวิจัย กล่าวถึงการทำงานของระบบรู้จำภาพอักษรล้านนาว่า “ในงานวิจัยนี้เราได้ศึกษาเกี่ยวกับการรู้จำภาพอักษร ก็คือการสอนให้คอมพิวเตอร์รู้ว่าตัวอักษรที่คอมพิวเตอร์เห็นมันเป็นตัวอะไร ตัวเขียนแบบนี้คือตัว ก ข ซึ่งเป็นเรื่องของการรู้จำภาพอักษร และในโครงการวิจัยนี้ก็ได้สร้างโปรแกรมคอมพิวเตอร์ขึ้นมาตัวหนึ่ง เพื่อที่จะรับข้อมูลที่เป็นภาพถ่ายใบลาน แล้วก็สั่งให้คอมพิวเตอร์ทำการพิมพ์ตามอักษรที่คอมพิวเตอร์เห็น ซึ่งผลลัพธ์ที่ได้มาก็จะได้เป็นไฟล์ Microsoft Word

วิธีการกว่าที่จะแปลงภาพถ่ายมาเป็นไฟล์ Microsoft Word ก็จะมีขั้นตอนการประมวลผลหลายขั้นตอน โดยขั้นตอนคร่าวๆ 2 ขั้นตอน ก็คือ การประมวลผลภาพและการรู้จำตัวอักษร

การประมวลผลภาพ คือ การปรับภาพต้นฉบับ input ที่เข้ามาให้อยู่ในรูปแบบที่เหมาะสมที่คอมพิวเตอร์จะนำตัวอักษรไปรู้จำได้ เริ่มต้นก็จะมีวิธีการแปลงภาพสีให้เป็นภาพขาวดำก่อน แล้วทำการลดสัญญาณรบกวน ทำการปรับภาพให้อยู่ในรูปแบบที่เหมาะสม ต่อมาก็จะมีการตัดข้อความเป็นบรรทัดๆ แล้วก็ตัด Crop แต่ละบรรทัดเป็นตัวอักษร

เมื่อคอมพิวเตอร์มีอักษรทุกๆ ตัวที่ปรากฏอยู่บนใบลานแล้ว ต่อมาคอมพิวเตอร์ก็จะนำเอาอักษรแต่ละตัวไปรู้จำ ว่าอักษรตัวนี้คือตัวอักษรอะไร แล้วก็ทำการพิมพ์มาตามลำดับที่ปรากฏอยู่บนใบลาน ก็จะได้เป็นไฟล์ Microsoft Word ซึ่งไฟล์ Microsoft Word นี้ เราก็สามารถเอาไปพิมพ์ซ้ำ หรือแก้ไขใหม่ได้”

ปัจจุบันงานวิจัยนี้ได้มีส่วนช่วยสนับสนุนกระบวนการสำรวจและอนุรักษ์คัมภีร์โบราณ โดยเป็นเครื่องมือในการจัดการสำเนาภาพถ่ายคัมภีร์โบราณ และแปลงภาพถ่ายสำเนาในรูปแบบไฟล์ภาพดิจิตอลเป็นไฟล์ข้อความ ซึ่งมีประโยชน์อย่างมากในการนำผลลัพธ์ที่ได้ไปต่อยอดทั้งในการเผยแพร่ และในการวิจัย โดยคณะผู้วิจัยได้เผยแพร่แอพพลิเคชั่น LannaOCR รุ่นทดลองใช้ที่ http://lannakadee.cmu.ac.th/lannaocr

งานวิจัยและพัฒนานี้ได้ดำเนินการอย่างต่อเนื่องเพื่อเพิ่มประสิทธิภาพของ Application ให้สูงขึ้น เพื่อตอบสนองความต้องการของผู้ใช้ให้ได้มากที่สุด โดย Application นี้ ถูกนำไปใช้งานจริงในโครงการสำรวจ รวบรวม และจัดทำระบบสารสนเทศสำเนาภาพถ่ายพระธรรมคัมภีร์ใบลานพระนครน่าน สมัยเจ้าอนันตวรฤทธิเดชฯ นอกจากนี้ส่วนหนึ่งของงานวิจัยนี้ยังเคยได้รับรางวัล The Best Student Paper Award จากงานประชุมวิชาการนานาชาติ 18th International Conference on Asia-Pacific Digital Libraries (ICADL 2016) ที่ประเทศญี่ปุ่นด้วย

ร่วมแสดงความคิดเห็น