Share on
×

Share

ชวนทำความรู้จัก OpenThaiGPT โมเดลภาษาไทย LLMs แบบเปิด ฝีมือคนไทย

ผู้บริหารบริษัท iApp Technology ร่วมเสวนาหัวข้อ OpenThaiGPT คนไทยทำเอง ภายใต้งานสัมมนาใหญ่ประจำปี “connect-the-dots #3: BIG DATA & AI ECOSYSTEM IN THAILAND” เจาะลึกแนวโน้มและความก้าวหน้าของวงการ Big Data และ AI ในประเทศไทย จัดขึ้นโดยสถาบันข้อมูลขนาดใหญ่ หรือ BDI 

ดร.กอบกฤตย์ วิริยะยุทธกร ผู้ก่อตั้ง บริษัท iApp Technology จำกัด และนายกสมาคมผู้ประกอบการปัญญาประดิษฐ์แห่งประเทศไทย ให้ข้อมูลว่า OpenThaiGPT เวอร์ชัน 1.0.0. เป็นโมเดลภาษาไทย LLMs แบบเปิดที่ทันสมัย และใหญ่ถึง 70 พันล้านพารามิเตอร์โมเดลแรกของโลก สามารถทำคะแนนสอบภาษาไทยได้เฉลี่ยสูงสุดเมื่อเทียบกับโมเดลภาษาไทยแบบเปิดอื่น ๆ สามารถรองรับการสนทนาโต้ตอบหลายครั้งแบบต่อเนื่อง (Multi-turn Conversation) ทั้งยังสามารถค้นหาข้อมูลและสกัดคำตอบบน Prompt ที่มีความยาวได้อย่างมีประสิทธิภาพ มีความรวดเร็วในการตอบคำถาม ด้วยการเพิ่มคำภาษาไทยที่พบบ่อยมากถึง 10,000 คำลงในพจนานุกรมของโมเดล “ไม่เพียงเท่านั้น ยังเรียนรู้บนข้อมูลภาษาไทย (Pretraining) กว่า 65,000 ล้านคำ มีการกำจัดข้อมูลภาษาไทยซ้ำซ้อนที่ใช้ในเรียนรู้ (Deduplicated Dataset) และปรับจูนให้ตอบคำถามทั่วไปภาษาไทย (Finetuning) มากกว่า 1 ล้านตัวอย่าง มีความสามารถเข้าใจและประมวลผล บริบทของข้อมูลภาษาไทยได้ถึง 4096 คำ และยังช่วยให้สามารถให้คำแนะนำที่ละเอียดและซับซ้อนได้

“ดร.กอบกฤตย์ วิริยะยุทธกร” จากเด็กติดเกม สู่นักพัฒนา AI แห่ง iApp Technology

OpenThaiGPT เกิดขึ้นจาก สมาคมผู้ประกอบการปัญญาประดิษฐ์ประเทศไทย (AIEAT) สมาคมปัญญาประดิษฐ์ประเทศไทย (AIAT) และทีมงานจากองค์กร ชั้นนำ อาทิ ศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติ (NECTEC) ข้อมูลที่ครอบคลุมหลากหลายและสำคัญจากกระทู้พันทิปดอตคอม นำมาเทรนด์โมเดล โดยเวอร์ชันใหม่นี้ มีการสร้างข้อมูล และเทรนด์โมเดลตอบปัญหาได้ดียิ่งขึ้น โดยข้อมูลที่ได้จากหน่วยงานภาครัฐและเอกชนมากกว่า 20 ดาต้าซอร์จ นำมาคัดสรร แล้วจัดระบบให้พร้อมใช้งาน

OpenThaiGPT เปรียบเหมือนสมองเทียมภาษาไทย ความรู้ระดับชั้น ม.6 สามารถพัฒนา และนำไปต่อยอดการใช้งานได้ เช่น โอเปอเรชัน ภาครัฐ การสร้างเอกสารตามเทมเพลตต่างๆ OpenThaiGPT สามารถช่วยในการเขียนบทความ จดหมายราชการ บันทึกข้อความต่าง ๆ แบบอัตโนมัติได้ ช่วยลดงานเอกสารทางราชการได้อย่างมหาศาล เราอาจมีหัวข้อในใจก็เขียนลงไป หรือใช้เสียงสั่งงานซึ่งจะมีเทมเพลตในเรื่องต่าง ๆ บันทึกเอาไว้ให้เลือก จากนั้น OpenThaiGPT ก็ดำเนินการให้ รวมไปถึงหน่วยงานที่ต้องตรวจเอกสารมากๆ เช่น การตรวจใบอนุญาตต่าง ๆ เดิมมีเอกสารมากต้องใช้เวลามาก สามารถทำเช็กลิสต์ แล้วนำข้อมูลมาแสกน ส่งให้ OpenThaiGPT เช็กให้ได้เลยว่าเอกสารเขียนได้ครบถ้วนตามเงื่อนไขหรือไม่ ทำให้การทำงานของภาครัฐลดเวลาลงได้มาก หรืออย่างเช่น ประชาชนมีเรื่องร้องเรียน ก็สามารถพูดบันทึกเสียง และแปลงเป็นข้อความบันทึกประจำวันออกมาได้

iApp เปิดตัว “จินดา” แชตบอต Gen AI ตอบโจทย์ร้านค้าออนไลน์ ใช้สะดวก-ง่าย 

ดร.กอบกฤตย์ ยังนำ OpenThaiGPT ไปทำแชตบอต ให้คำปรึกษากฎหมายไทย (น้อง ทนอย) สามารถตอบคำถามด้านกฎหมายได้ทันที ซึ่งมีประโยชน์สำหรับประชาชนทั่วไป ที่เข้าถึงนักกฎหมายได้ยาก ก็สามารถสอบถามข้อกฎหมายจากน้องทนอยก่อนได้ ซึ่งไม่ได้มีเพียงแชตบอตเท่านั้น แต่ยังพัฒนาเป็นเครื่องมือด้านภาษาได้อีก เช่น เทมเพลตบัตรประชาชน หรือหนังสือเดินทางประเทศไทย ที่มีมาตรฐานตายตัว ก็สามารถแกะแบบตัวอักษรออกมาได้ และมีความแม่นยำสูง

“นี่เป็นตัวอย่างการใช้ LLMs เข้ามาสนับสนุนการทำงานในองค์กร ให้มีความสะดวกรวดเร็วยิ่งขึ้นเพราะนี่คือ OpenThaiGPT: Thailand’s Intellectual Companion (OpenThai GPT : คู่หูทางปัญญาของไทย)” ดร.กอบกฤตย์ กล่าว

ข่าวอื่น ๆ ที่น่าสนใจ

TAGTHAi จับมือ Google Cloud ใช้ AI ช่วยวางแผนการท่องเที่ยว ครบ จบ ในที่เดียว

BDI โชว์แพลตฟอร์ม Envi Link ใช้ AI วัดค่าคาร์บอนฟุตพรินต์เมืองภูเก็ต นำร่องเมืองท่องเที่ยวคาร์บอนต่ำ

×

Share

ผู้เขียน