Subword: Từ con, từ tố, chữ, ... #2551
Replies: 3 comments 3 replies
-
yeah có vẻ |
Beta Was this translation helpful? Give feedback.
-
Chắc đúng nhất mình sẽ sử dụng cách dịch generic thay vì
|
Beta Was this translation helpful? Give feedback.
-
Em nghĩ dịch là |
Beta Was this translation helpful? Give feedback.
-
Tiếng anh thì họ có
character -> word
.Tiếng việt mình có
chữ cái (một kí tự) -> chữ (một âm) -> từ (một nghĩa)
.Ở tiếng anh bên Linguistic xen giữa
character
vàword
thì họ cómorpheme - hình vị / từ tố = đơn vị nhỏ nhất có ý nghĩa
(và có thể nhiều cái khác nữa).Bên NLP thì họ xài
subword
, theo mình hiểu là chỉ chung cho nhiều phương pháp tách từ khác nhau như BPE, wordpiece, sentencepiece các kiểu https://medium.com/@makcedward/how-subword-helps-on-your-nlp-model-83dd1b836f46Mình thấy bác @LongNguyen1984 đang dịch
subword
làtừ tố
, tức là bằng vớimorpheme
, mình thấy nghe khá hay nhưng sợ không chuẩn.Từ con
Từ tố
-- tách từ theo ý nghĩaChữ
-- tách từ theo âmThành phần từ
-- https://trituenhantao.io/tu-dien-thuat-ngu/subword/Beta Was this translation helpful? Give feedback.
All reactions