NLP(自然语言处理)作为人工智能一大分支,目前主要的落地场景有三大类:搜索、智能问答、智能写作。其中,搜索领域已经有谷歌、百度等巨头占领大部分市场份额;智能问答由于业务场景多样化,人机交互层面还有许多技术尚未成熟,同时产品也存在标准化的问题,距离商业落地还有一定距离。
智能写作成为NLP另一个具备大规模应用潜力的技术,目前主要体现在文字端的处理能力比较成熟。国外媒体从07年开始尝试AI写作,到14年美联储已经使用Wordsmith平台撰写财报新闻,同年Automated Insights生产内容篇数达到10亿;国内方面,15-16年也迎来AI写作的高速发展,腾讯、新华社、今日头条相继推出智能写作产品从新闻领域切入。随着大量同类产品进入市场,智能写作的原创性、通顺度成为产品竞争力的关键。
深圳市智搜信息技术有限公司(以下简称“智搜”)是一家内容创作机器人研发商,公司成立于2013年,产品经过5年的研发,在2018年正式落地,面向媒体、营销公关、党政机关、财经领域的企业服务市场和个人用户提供内容创作的SaaS服务,以人机协作的形式生成内容。
从核心技术上看,内容创作机器人需要底层大量素材的积累以及算法模型支持原创性及通顺度。团队已经构建了营销、资讯以及金融领域的知识图谱,知识图谱节点达到亿级。同时,对资讯、营销和金融领域的所有文章、段落、句子、知识等素材不断打标签,拥有了50亿以上的营销素材。
算法方面,团队采取了WikiAnswers,Quora,TCNP,LCQMC等专业训练集,同时还开发了非监督的中文语言生成模型,基于百亿级的文章进行训练,具备了原创的写作能力,系统可在5秒内生成10篇原创文章,每篇字数在1000-2000字,通顺度达到80%左右。
公司的业务场景根据企业服务、个人用户分为两种:
对于媒体、金融、机关、营销类企业客户,公司提供Saas平台,生成研报、新闻、思想报告类文章。首先,系统会基于大数据和算法挖掘、跟踪信息点,5秒内生成多篇底稿;之后,用户可根据系统生成的文章对不满意的地方进行修改,系统在这一阶段起到分类素材推荐、查重/改写等辅助功能;最后,对于需要在网上公开发布的文章,系统利用AI算法模型将关键词标签化,自动生产SEO标题和文章,方便后期搜索引擎进行收录。
对于自媒体这种中小企业客户/个人用户,系统以官网的形式(www.giiso.com)完成内容创作。操作流程与Saas平台的工作方式类似,只不过不需要与公司内容系统对接。智搜联合创始人郑海涛表示,公司今年开始主推C端市场,目前产品在满足自媒体对于内容原创性的要求方面具备核心技术优势,下一步要在多样化上做研发,迎合自媒体对个性化的需求。公司能够帮助用户实现文章裂变,支持月卡、年卡、单篇付费机制,分享文章可获得金币获得折扣,输入一篇文章后可快速生成数十上百篇文章;后期系统还将联合版权方开发基于图片、直播、小视频的内容创作。在市场策略上,公司会以分销的形式,向分享系统链接的用户发放提成,实现用户裂变。
营收方面,公司目前主要以Saas模式收取企业客户的年服务费,可按照公司内部的账户数量收费,也有一次性过百万元的项目合作费用。公司已经积累了中国经济日报、深圳报业集团、厦门报业集团、中国太平洋保险集团、上海证券交易所、公安党政机关等大客户,2018-2019年营收过千万。郑海涛表示,公司从今年开始重点开发个人用户(包括中小企业客户)市常
公司团队目前约20人,联合创始人郑海涛是清华大学计算机系副教授,担任国家863项目副组长,主持多项国家自然科学项目,以及多项教育部,广东省和深圳市项目,是中国大数据语义挖掘领域的领军人物。公司最近一笔融资是在2017年获得民银资本领投,金沙江创投跟投的2000万元A轮融资。公司正在寻求B轮融资。