A Curated List of LLM Models for Taiwanese Users#
Note
Hey guys, this is my personal reading note. I am not sure there might be some mistakes in my understanding. Please feel free to correct me (hsiangjenli@gmail.com) if you find any. Thanks!
Llama-3-Taiwan - https://huggingface.co/collections/yentinglin/taiwan-llm-6523f5a2d6ca498dc3810f07
Llama3-TAIDE - https://huggingface.co/taide/Llama3-TAIDE-LX-8B-Chat-Alpha1
Trustworthy AI Dialogue Engine, TAIDE#
可信任生成式 AI 對話引擎
背後緣由
大部分的中文資料集都是簡體中文,導致模型回應出的內容跟臺灣習慣的用法不同
因此,希望確保台灣「數位主權」的議題,從 112 年開始此專案進行
資料集來源大多是法規資料庫、字典,可參考 https://taide.tw/index/training-data
國家實驗研究院
中翻英
英翻中
自動摘要
寫信、文章
Available Models#
[Llama2/可商用] taide/TAIDE-LX-7B
[Llama2/可商用] taide/TAIDE-LX-7B-Chat
[Llama2/可商用] taide/TAIDE-LX-7B-Chat-4bit
taide/Llama3-TAIDE-LX-8B-Chat-Alpha1
taide/Llama3-TAIDE-LX-8B-Chat-Alpha1-4bit
LX-13B (學研用版本)模型
訓練用的資料集 - https://taide.tw/index/training-data
評測方法程式碼 - taide-taiwan/taide-bench-eval