线上澳门葡京网

炼数成金 商业智能自然语言处理
订阅

自然语言处理

基于预训练自然语言生成的文本摘要方法
线上澳门葡京平台
在本文中,我们基于编码器-解码器框架提出了一种新颖的基于预训练的方法,该方法可以由给定输入序列以两阶段的方式生成输出序列。对于编码器,我们使用 BERT 将输入序列编码为上下文语义表示。对于解码器,在我们的 ...
如何理解自然语言处理中的注意力机制?
线上澳门葡京平台
近些年来,注意力机制一直频繁的出现在目之所及的文献或者博文中,可见在nlp中算得上是个相当流行的概念,事实也证明其在nlp领域散发出不小得作用。这几年的顶会paper就能看出这一点。本文深入浅出地介绍了近些年的 ...
秒懂的RPA解读
线上澳门葡京平台
RPA(Robotic Process Automation),译为流程自动化机器人,又可以称为数字化劳动力(Digital Labor),是一种智能化软件,通过模拟并增强人类与计算机的交互过程,实现工作流程中的自动化。RPA具有对企业现有系统 ...
万字长文概述NLP中的深度学习技术
万字长文概述NLP中的深度学习技术
自然语言处理(NLP)是指对人类语言进行自动分析和表示的计算技术,这种计算技术由一系列理论驱动。NLP 研究从打孔纸带和批处理的时代就开始发展,那时分析一个句子需要多达 7 分钟的时间。到了现在谷歌等的时代,数 ...
出身清华姚班,斯坦福博士毕业,她的毕业论文成了「爆款」
出身清华姚班,斯坦福博士毕业,她的毕业论文成了「爆款」
很少有人的博士论文能够成为「爆款文章」,但陈丹琦做到了。这位近日从斯坦福毕业的计算机科学博士引发了人们的广泛关注。据斯坦福大学图书馆介绍,她长达 156 页的毕业论文《Neural Reading Comprehension and Beyo ...
lazynlp:构建大规模语料库的"懒人"工具箱
lazynlp:构建大规模语料库的"懒人"工具箱
lazynlp,目的是提供一个直接的库让用户直接抓取、清洗和对相关网页进行清洗,以生成一个大规模的单语语料库。使用这个库,用户可以直接生成一个比OpenAI 用于 GPT-2 训练数据还要大的数据集。根据该项目github主页 ...
BERT、GPT-2这些顶尖工具到底该怎么用到我的模型里?
BERT、GPT-2这些顶尖工具到底该怎么用到我的模型里?
近期的NLP方向,ELMO、GPT、BERT、Transformer-XL、GPT-2,各种预训练语言模型层出不穷,这些模型在各种NLP任务上一次又一次刷新上线,令人心驰神往。但是当小编翻开他们的paper,每一个上面都写着四个大字:“弱者 ...
迄今最大模型?OpenAI发布参数量高达15亿的通用语言模型GPT-2
迄今最大模型?OpenAI发布参数量高达15亿的通用语言模型GPT-2
几个月前谷歌推出的语言模型 BERT 引发了业内的广泛关注,其 3 亿参数量刷新 11 项纪录的成绩让人不禁赞叹。昨天,OpenAI 推出了一种更为强大的算法,这一次模型达到了 15 亿参数。这种机器学习算法不仅在很多任务上 ...
Google BERT 中文应用之春节对对联
Google BERT 中文应用之春节对对联
在网上看到有人用 seq2seq 训练一个对对联的机器人,很好奇能不能用Google的BERT预训练模型微调,训练出一个不仅可以对传统对子,也可以对新词新句的泛化能力更好的对对联高手。今天大年初一,这样的例子刚好应景。 ...
效果惊人的GPT 2.0模型:它告诉了我们什么
效果惊人的GPT 2.0模型:它告诉了我们什么
未来两年NLP可能会不断爆出类似的刷屏新闻,真的进入一个技术快速发展期。按理说,这是NLP研发者的黄金期,这种时期最容易出好的成果,但是事实上,很可能你只能作为看热闹的看客,眼看他起高楼,眼看他宴宾客,但是 ...
15亿参数!史上最强通用NLP模型诞生:狂揽7大数据集最佳纪录
15亿参数!史上最强通用NLP模型诞生:狂揽7大数据集最佳纪录
OpenAI今天在官博上介绍了他们的新NLP模型,刷新了7大数据集的SOTA(当前最佳结果),并且能够在不进行任何与领域知识相关数据训练的情况下,直接跨任务执行最基础的阅读理解、机器翻译、问答和文本总结等不同NLP任务 ...
AI Challenger 2018 机器翻译参赛总结
AI Challenger 2018 机器翻译参赛总结
机器翻译的开源库很多,比如 OpenNMT、FairSeq 和 tensor2tensor 等,我们主要是基于 tensor2tensor 等工具库进行的程序实现。它是 Google 基于 TensorFlow 开发的高级库,内置了许多经典模型,开发调试比较方便。 ...
现有模型还「不懂」自然语言:20多位研究者谈NLP四大开放性问题
现有模型还「不懂」自然语言:20多位研究者谈NLP四大开放性问题
我认为最大的开放性问题是关于自然语言理解的。我们应该通过构建文本表征,开发出能像人类一样阅读和理解文本的系统。在那之前,我们所有的进步都只是在提升系统模式匹配的能力。在专家采访中,很多专家认为自然语言 ...
近900000条if-then关系图谱,让神经网络“懂”常识推理
近900000条if-then关系图谱,让神经网络“懂”常识推理
“神经网络能学习日常事件的常识推理吗?能,如果在 ATOMIC 上训练的话。”ATOMIC(原子) 是一个机器常识图集,一个用自然语言建立的 870, 000 个 if-then 关系的图谱。这一项目的研究者是来自华盛顿大学艾伦人工智 ...
NLP Chinese Corpus项目:大规模中文自然语言处理语料
NLP Chinese Corpus项目:大规模中文自然语言处理语料
众所周知,中文NLP领域缺乏高质量的中文语料。作者徐亮(实在智能算法专家) 创建了一个中文自然语言处理语料库项目:nlp_chinese_corpus ,初步贡献了几个已经预处理好的中文语料,包括维基、新闻和百科语料。希望大 ...

热门频道

  • 大数据
  • 商业智能
  • 量化投资
  • 科学探索
  • 创业

即将开课

社区热帖

     

    GMT+8, 2019-3-18 18:24 , Processed in 0.106274 second(s), 16 queries .