ผลวิเคราะห์ทักษะบัณฑิตหลักสูตรด้านคอมพิวเตอร์จากปริญญานิพนธ์ (เวอร์ชั่น 0.1) เป็นความคืบหน้าส่วนหนึ่งของ OKR Human Cloud รับผิดชอบโดยสำนักบริการคอมพิวเตอร์
- วิเคราะห์ข้อมูลโดย น.ส. ภัทรพร ลอยหา และ น.ส. อัญญากัลป์ เตชะพีระสิทธิ์ (นักศึกษาฝึกงานภาคฤดูร้อน จากหลักสูตรวิทยาการข้อมูลและการวิเคราะห์เชิงธุรกิจ คณะเทคโนโลยีสารสนเทศ สจล.)
- วางกรอบการทำงานและจัดทำแผนภาพโดย ผศ.ดร. รัฐชัย ชาวอุทัย (อาจารย์ภาควิชาวิศวกรรมคอมพิวเตอร์ และ ผู้ช่วยผู้อำนวยการสำนักบริการคอมพิวเตอร์ สจล.)
- สนับสนุนข้อมูลโดย สำนักหอสมุดกลาง สจล.
- สนับสนุนการปฏิบัติงานโดย ผู้บริหารและทีมงาน สำนักบริการคอมพิวเตอร์ สจล.
ขั้นตอนการวิเคราะห์
- นำข้อมูลปริญญานิพนธ์จากระบบของสำนักหอสมุดกลาง ประกอบด้วย ชื่อผู้แต่ง, หลักสูตร, ภาควิชา, คณะ, ปีการศึกษา, หัวข้อปริญญานิพนธ์, และ คำสำคัญ
- กำหนดทักษะด้านคอมพิวเตอร์ 4 ทักษะ คือ Software, Data Analysis, Network, และ Hardware โดยศึกษาข้อมูลทั้งหมดแล้ว ระบุค่าว่าแต่ละทักษะควรจะประกอบไปด้วยคำศัพท์ (key terms) อะไรบ้าง
- นำชื่อปริญญานิพนธ์และคำสำคัญ ไปผ่านกระบวนการตัดคำแล้วนับจำนวนคำศัพท์ที่เกี่ยวข้องกับแต่ละทักษะ เพื่อสรุปว่าแต่ละปริญญานิพนธ์เป็นทักษะประเภทใด
- นำมาแสดงผลด้วย Microsoft Power BI
ข้อจำกัดและแนวทางแก้ปัญหา
- เนื่องจากข้อมูลที่ได้รับเป็นภาษาไทย จึงเกิดข้อจำกัดด้านการใช้เทคนิค Stemming และ Lemmatization ดังนั้น จึงทำให้หลายปริญญานิพนธ์ไม่ถูกจัดประเภทตามทักษะ (เกิดค่า False Negative สูง)
- ข้อมูลที่ได้รับไม่มีบทคัดย่อ ซึ่งเป็นส่วนสำคัญที่จะช่วยให้การจัดประเภททักษะได้แม่นยำขึ้น
- ดังนั้นในลำดับต่อไป ในการวิเคราะห์จะต้องใช้ข้อมูลภาษาอังกฤษ รวมถึงใช้บทคัดย่อภาษาอังกฤษ และขอความร่วมมือผู้เชี่ยวชาญแต่ละหลักสูตรร่วมกันพัฒนาออนโทโลยีของคำศัพท์ในแต่ละทักษะเพื่อใช้การจัดประเภทเบื้องต้น แล้วนำไปสู่การใช้ Machine Learning เพื่อช่วยในการจัดประเภทให้มีประสิทธิภาพยิ่งขึ้น