bert的uncased和cased的区别.docx

所需积分/C币: 43
浏览量·279
DOCX
11KB
2021-09-16 11:44:10 上传
*Lisen
  • 粉丝: 46
  • 资源: 45
精品专辑
内容简介:Uncased 表示在 WordPiece tokenization 之前文本已经变成小写了,例如,JohnSmith becomes john smith。Uncased 模型也去掉了所有重音标志。Cased 表示保留了真实的大小写和重音标记。通常,除非你已经知道大小写信息对你的任务来说很重要(例如,命名实体识别或词性标记),否则 Uncased模型会更好。