docs/nlp_old/1.入门介绍.md
| 中文 | 英文 | 描述 |
|---|---|---|
| 分词 | Word Segmentation | 将连续的自然语言文本,切分成具有语义合理性和完整性的词汇序列 |
| 命名实体识别 | Named Entity Recognition | 识别自然语言文本中具有特定意义的实体(人、地、机构、时间、作品等) |
| 词性标注 | Part-Speech Tagging | 为自然语言文本中的每个词汇赋予一个词性(名词、动词、形容词等) |
| 依存句法分析 | Dependency Parsing | 自动分析句子中的句法成分(主语、谓语、宾语、定语、状语和补语等成分) |
| 词向量与语义相似度 | Word Embedding & Semantic Similarity | 依托全网海量数据和深度神经网络技术,实现了对词汇的向量化表示,并据此实现了词汇的语义相似度计算 |
| 文本语义相似度 | Text Semantic Similarity | 依托全网海量数据和深度神经网络技术,实现文本间的语义相似度计算的能力 |
| 篇章分析 | Document Analysis | 分析篇章级文本的内在结构,进而分析文本情感倾向,提取评论性观点,并生成反映文本关键信息的标签与摘要 |
| 机器翻译技术 | Machine Translating | 基于互联网大数据,融合深度神经网络、统计、规则多种翻译方法,帮助用户跨越语言鸿沟,与世界自由沟通 |
分词(Word Segmentation) : 将连续的自然语言文本,切分成具有语义合理性和完整性的词汇序列
例句: 致毕业和尚未毕业的同学。
致 毕业 和 尚未 毕业 的 同学致 毕业 和尚 未 毕业 的 同学其他案例:
命名实体识别(Named Entity Recognition): 识别自然语言文本中具有特定意义的实体(人、地、机构、时间、作品等)
例句: 天使爱美丽在线观看
天使 爱 美丽 在线 观看其他案例:
评论: 房间里还可以欣赏日出
歧义:
词向量与语义相似度(Word Embedding & Semantic Similarity): 对词汇进行向量化表示,并据此实现词汇的语义相似度计算。
例如: 西瓜 与 (呆瓜/草莓),哪个更接近?
文本语义相似度(Text Semantic Similarity): 依托全网海量数据和深度神经网络技术,实现文本间的语义相似度计算的能力
例如: 车头如何防止车牌 与 (前牌照怎么装/如何办理北京牌照),哪个更接近?
篇章分析(Document Analysis): 分析篇章级文本的内在结构,进而分析文本情感倾向,提取评论性观点,并生成反映文本关键信息的标签与摘要
例如:
机器翻译技术(Machine Translating): 基于互联网大数据,融合深度神经网络、统计、规则多种翻译方法,帮助用户跨越语言鸿沟,与世界自由沟通