[TOC]
经过测试,只支持中文。
2020-06-11,openAi 公司发布其基于 GPT-3 模型的接口,GPT-3 是耗费上千万训练出来的顶级自然语言处理模型,包含有 1750 亿个参数。
该接口是,Text in,Text out
类型的接口,我已申请使用该接口。等有空玩一玩。
相关的项目:awesome-gpt3,gpt3-sandbox,gpt-3-experiments 品玩 gpt-3
百度云、阿里云
- ACL: Association for Computational Linguistics() 国际计算语言协会
- AACL 亚太分会
- EMNLP: Empirical Methods in Natural Language Processing
- IJCNLP: International Joint Conference on Natural Language Processing, EMNLP 和 IJCNLP 合并
- NLPCC: Natural Language Processing and Chinese Computing
-
第一阶段:TBSL 手动定义问题模板 2012
TBSL Template-Based Model 的两个核心贡献:
- Constructs a query template that directly mirrors thelinguistic structure of the question
- Instantiates the template by matching natural language expressions with ontology concepts
TBSL的模板定义为SPARQL query模板, 将其直接与自然语言相映射。
-
第二阶段:Semantic Parsing-Based Model 自动生成模板 2017
- 提出了QUINT,能够根据utterance-answer对,根据依存树自动学习utterance-query模板
- 利用自然语言的组成特点, 可以使用从简单问题中学到的模板来解决复杂问题
BERT虽然是个划时代的模型,但它真正应用起来却无法避免finetune步骤,只能通过两种方式盈利:
- 买方提需求,卖方出人力精调,赚这个需求的钱。但之后每个需求还是要付出一样的人力,边际成本不能很好递减
- 买方直接购买基模型,做一次性生意,无法持续获利
以上两种方式都不够理想,使得BERT不能成为一个长期产品。而GPT-3的NB之处,就在于它的zero-shot能力,在不精调、或者利用prompt的情况下就有一定效果,显著减少了第一种模式的边际成本,可以通过卖服务长期捞金。