0%

todo-基于LLM应用层的文本分析

Posted on 2024-09-18 In code Views:

简介

TODO.

基于LLM应用层的文本分析
应用区别于基础，基础强调模型架构、模型训练等环节。
传统NLP
词性标注
近义词判断（embedding）
NER
SpaCy
NLTK
LLM
通用模型适合做 Summary
Proxy、在线 Finetune、最佳 base model
Prompt：CoT、特殊字符分隔符、Agent都是有效的，但是目前最佳Prompt 范式还没有形成。
Normalization：定义 + embedding + 设计度量值（余弦相似度、曼哈顿距离/L1范数） + 聚类。