เพียงเวลาไม่นานที่เราได้เห็นการเติบโตอย่างก้าวกระโดดของ Generative AI ที่ทำให้ AI เป็นได้มากกว่าเครื่องมือในการวิเคราะห์ข้อมูล แต่ยังมีขีดความสามารถในการ “สื่อสารและสร้างสิ่งใหม่” จากชุดข้อมูลต่าง ๆ โดยใช้เทคโนโลยีหลักอย่างแมชชีนเลิร์นนิง (Machine Learning) และการประมวลผลภาษาธรรมชาติ (NLP) ในการพัฒนาโมเดลภาษาขนาดใหญ่ (Large Language Model: LLM) ให้มีความเก่งกาจ สามารถต่อยอดไปเป็นแอปพลิเคชันที่หลากหลายเพื่อประโยชน์ต่อธุรกิจและสังคม
THaLLE (ทะเล) โดย กสิกร บิซิเนส-เทคโนโลยี กรุ๊ป (KBTG) เป็นโมเดล LLM ภาษาไทยที่ถูกพัฒนาให้เป็นโมเดลฐาน (Foundation Model) ที่นำไปสู่การพัฒนานวัตกรรมที่ตอบโจทย์ธุรกิจการเงินการธนาคาร รวมถึงการเป็นผู้ช่วยในการเสริมเติมองค์ความรู้ด้านการเงินการลงทุนของคนไทย ดนุภัทร คำนวนสินธุ์ Advanced Research Engineer, KBTG และ ดร.ธวัลรัตน์ ชโลธร Senior Research Engineer (Head of Language Understanding), KBTG ตัวแทนจากทีมพัฒนาชวน The Story Thailand ย้อนรอยเส้นทางความท้าทายจนสามารถเปิดตัว THaLLE สู่การใช้งานได้ในที่สุด
THaLLE โมเดล LLM ภาษาไทยด้านการเงิน
ดนุภัทร กล่าวถึงที่มาที่ไปของ THaLLE หรือ Text Hyperlocally Augmented Large Language Extension ว่า เป็นโมเดล AI ภาษาไทยที่นำมาพัฒนาต่อยอดความรู้ความสามารถด้านการเงิน ให้มีความเก่งกว่าโมเดล AI ที่เป็น Open Source ทั่วไป เพื่อสนับสนุนการทำงานของธนาคารกสิกรไทยและบริษัทในเครือ ซึ่งต่อมาได้มีการพัฒนาให้มีความสามารถด้านอื่น ๆ เพิ่มเติม
“แรกเริ่มเดิมทีเราใช้วิธีสำรวจและทดสอบโมเดล LLM หลายตัวในท้องตลาด แต่ไม่พบโมเดลตัวใดที่ตอบโจทย์ได้จริง จึงพัฒนา THaLLE ขึ้นมา เพื่อเป็น In-House LLM สำหรับการใช้งานในธนาคาร เริ่มจากทำการศึกษาและประมวลสิ่งที่ลูกค้ามักตั้งคำถาม ทำความเข้าใจข้อมูลในองค์กรอย่างถ่องแท้ นำมาฝึกสอน THaLLE ในการค้นหาคำตอบด้านการเงิน และการลงทุนได้อย่างถูกต้อง และมีประสิทธิภาพ”

สำหรับทีมพัฒนาเป็นทีมจาก KBTG Labs ซึ่งเชี่ยวชาญด้าน NLP แบ่งการทำงานออกเป็น 3 ทีม ได้แก่ ทีมข้อมูล (Data) เป็นทีมที่จะพิจารณาว่าข้อมูลที่ได้มาสามารถนำไปใช้ฝึกสอน AI ได้เลยหรือต้องปรับเปลี่ยนรูปแบบข้อมูลเสียก่อน เช่น เปลี่ยนจากไฟล์ PDF เป็น Text ก่อนนำไปใช้
ทีมฝึกสอน AI (Training) ทีมนี้จะรับข้อมูลที่ได้มาไปใช้ในการฝึกโมเดล AI เช่น การทำ pre-training รือ fine-tuning เพื่อการทำงานได้มีประสิทธิภาพ ตรงตามความต้องการหรือตรงกับขอบเขตงานที่สนใจ
ทีมประเมินผล (Evaluation) ทีมนี้ทำหน้าที่สอบทานเพื่อยืนยันความถูกต้องว่า AI ที่ฝึกสอนสามารถตอบโจทย์ยูสเคสได้จริง และเป็นผู้มีอำนาจตัดสินใจว่าจะปล่อยโมเดล AI ดังกล่าวไปให้ฝ่ายธุรกิจได้ทดลองใช้งานหรือไม่
“เรามีการพัฒนาเทคโนโลยีสำคัญ อาทิ การควบรวมระบบสืบค้นข้อมูลโดยใช้เทคนิค Learning to rank (LTR) เพื่อรองรับระบบค้นหาข้อมูลที่หลากหลายให้สามารถทำงานร่วมกันได้อย่างมีประสิทธิภาพ และ Ontology Population ในการดึงคำตอบแบบกราฟ ซึ่งผลงานทั้ง 2 ชิ้นได้รับการเผยแพร่สู่สาธารณะ และถูกจัดอยู่ในอันดับ A* โดย ACL ซึ่งเป็นการประชุมด้าน NLP ของโลก” ดร.ธวัลรัตน์ กล่าว
เทคโนโลยีเปลี่ยนเร็ว ความท้าทายหลัก
THaLLE เป็นโปรเจกต์ที่ทำงานภายใต้ “สภาพแวดล้อมที่มีความไม่แน่นอนสูง มีระยะเวลาการพัฒนาที่ค่อนข้างจำกัดและกระชั้นชิด เพื่อปล่อยสู่การใช้งานให้เร็วที่สุดเท่าที่จะเป็นไปได้” เนื่องจากโลกของเทคโนโลยี AI แมชชีนเลิร์นนิง (Machine Learning) และโมเดลภาษาขนาดใหญ่ (LLM) มีงานวิจัยพัฒนาใหม่ ๆ ออกมาอย่างรวดเร็วแทบทุกสัปดาห์ ดังนั้น การทำงานที่ล่าช้าเกินไป อาจทำให้โมเดลที่พัฒนาเก่า ล้าสมัย หรือไม่สามารถแข่งขันกับโมเดลที่พัฒนาออกมาใหม่ในระยะเวลาเดียวกันได้
ดนุภัทร เล่าว่า เคยมีกรณีที่ทีมงานพัฒนาโมเดล AI ด้านภาษามาระยะหนึ่ง จนถึงจุดที่มั่นใจและพร้อมเปิดตัวสู่สาธารณะ ปรากฎว่ามีโมเดลที่มีขีดความสามารถที่ดีกว่าออกมาตัดหน้า ทำให้ต้องเปลี่ยนแผนกลางคันหรือต้องแก้ปัญหาเฉพาะหน้าโดยการปรับเปลี่ยนโซลูชันหรือปรับสัดส่วนของทรัพยากรบางอย่าง

“Practical and Flexible จึงเป็นแนวทางในการพัฒนาโมเดล THaLLE ที่ต้องใช้งานได้จริง มีความยืดหยุ่นสูง ปรับตัว และเปิดรับต่อความเปลี่ยนแปลงโดยเฉพาะ AI หรือแมชชีนเลิร์นนิงเวอร์ชันใหม่ ๆ ที่เกิดขึ้นอยู่ตลอดเวลา รวมถึงการปรับปรุงโมเดลให้นำไปต่อยอดหรือใช้งานร่วมกับโมเดลอื่น ๆ ได้ โดยไม่ยึดติดกับเทคโนโลยีที่ใช้พัฒนาอยู่เบื้องหลัง หรือสิ่งที่เคยทำมาในอดีต”
นอกจากนั้น ทีมงานจะต้องเฝ้าติดตามเทคโนโลยีเกิดใหม่ (Frontier) ตลอดเวลา เพราะ Generative AI ยังเป็นเรื่องใหม่ของโลก เป็นงานที่ KBTG ไม่ได้มีองค์ความรู้มากนัก จำเป็นต้องมีทีมงานในการศึกษาและติดตามงานวิจัยพัฒนา หรือเทคนิคใหม่ ๆ ที่ตีพิมพ์เผยแพร่ออกมา เพื่อประกอบการพัฒนาวิธีการทำงานอยู่ตลอดเวลา
เนื่องจาก LLM เป็นโมเดลภาษาขนาดใหญ่ ต้องใช้ทรัพยากรจำนวนมาก ต้องใช้เซิร์ฟเวอร์ขนาดใหญ่ในการประมวลผล ซึ่งภาคธุรกิจและอุตสาหกรรมของไทยยังไม่พร้อมใช้เทคโนโลยีในสเกลที่ใหญ่ระดับนี้ KBTG จึงเน้นการพัฒนาเแบบย่อส่วนลงเป็นโมเดลขนาดเล็กและขนาดกลาง เพื่อรองรับการใช้งานเฉพาะด้าน โดยปัจจุบัน THaLLE พัฒนาบนโมเดลเกวน 2.5 (Qwen 2.5) ที่ขนาด 7-8 พันล้านพารามิเตอร์ ซึ่งเป็นขนาดที่มีประสิทธิภาพพอเหมาะกับการใช้งาน ไม่สิ้นเปลืองทรัพยากรมากจนเกินไป และยังนำไปพัฒนาต่อยอดเป็นแอปพลิเคชันการใช้งานด้านบริการการเงินการธนาคารต่าง ๆ ได้ดี
จุดเด่นที่แตกต่าง
ปัจจุบัน THaLLE ขยายขีดความสามารถด้านการเงินให้ทำงานได้ทั้งภาษาไทย และภาษาอังกฤษ จากเวอร์ชันแรกที่มีเฉพาะภาษาอังกฤษ เนื่องจากธนาคารมียูสเคสหรือความต้องการใช้งาน AI ภาษาไทยด้านการเงินเป็นจำนวนมาก จึงมีการพัฒนาต่อยอด ทดสอบและติดตามผลการใช้งานภาษาไทยของลูกค้าในยูสเคสต่าง ๆ ของธนาคาร ซึ่งเกิดประสิทธิผลดี และกำลังอยู่ระหว่างปรับปรุงต่อเนื่องให้การใช้งานสมบูรณ์มากขึ้นในอนาคต
ดร.ธวัลรัตน์ กล่าวว่า จุดเด่นของ THaLLE มี 2 ส่วน ส่วนแรกเป็นเรื่องของ “ประสิทธิภาพ” จากความสามารถในการผ่านการสอบวัดความรู้ด้านการเงินที่ได้รับการยอมรับในระดับสากล (CFA) ซึ่งเป็นเครื่องการันตีความเข้าใจในองค์ความรู้และบริบทด้านการเงินการธนาคารได้ดีในระดับหนึ่งเมื่อเทียบกับ AI ด้านการเงินที่มีอยู่ในปัจจุบัน ส่วนที่ 2 คือ การพัฒนาให้เป็น “โอเพน ซอร์ส” (Opensouce) ด้านการเงินการธนาคาร ที่ทุกคนสามารถหยิบไปต่อยอดให้ THaLLE มีความเก่งกาจหรือเชี่ยวชาญเฉพาะด้านเพิ่มเติม เช่น เป็นผู้ช่วยด้านการลงทุน การตอบคำถามเรื่องหุ้น หรือพัฒนาเป็นแชตบอตในการตอบคำถามด้านการเงินการธนาคาร
LLM เพื่อทุกอุตสาหกรรม
สำหรับแผนในอนาคต คือ การพัฒนาศักยภาพการทำงานให้สูงขึ้น เพื่อรองรับการสร้างระบบบนิเวศ (THaLLE Ecosystem) ที่นอกจากภาคธุรกิจการเงินการธนาคาร ยังมุ่งให้เกิดการขยายผลไปสู่ภาคการศึกษา ภาคอุตสาหกรรมอื่น ๆ ที่ต้องการพัฒนาและยกระดับประสิทธิภาพด้าน AI อาทิ ความร่วมมือระหว่าง KBTG กับ AI Singapore และ Google Research ในโครงการซีลด์ (Project SEALD) เพื่อขับเคลื่อนการพัฒนา LLM ในภูมิภาคเอเชียตะวันออกเฉียงใต้ เป็นต้น
แม้จุดเริ่มต้นของ THaLLE จะถูกพัฒนาขึ้นเพื่อตอบโจทย์การเป็นผู้เชี่ยวชาญด้านการเงินการธนาคาร แต่ KBTG มีความมุ่งหวังให้เกิดความร่วมมือในการพัฒนา LLM ภาษาไทย โดยฝีมือคนไทย ให้มีความเก่งเทียบเท่าหรือเก่งกว่า LLM ตัวอื่นในตลาด ตลอดจนสนับสนุนการประยุกต์ใช้งานให้เกิดประโยชน์ในด้านต่าง ๆ ที่เป็นการยกระดับศักยภาพของคนไทย คุณภาพของสังคมไทยและประเทศไทย ให้ดีขึ้นได้ด้วยเทคโนโลยีในที่สุด
ข่าวอื่น ๆ ที่น่าสนใจ
KBTG ประกาศเป้าหมายปี 2568 มุ่งสู่ยุค Agentic AI ด้วย “Human-First x AI-First”
เปิดแผนยุทธศาสตร์ KBTG …. The Year of Agentic AI 2025