查看: 94|回复: 0

[等待归档] 机器之心开放人工智能专业词汇集(附Github地址)

[复制链接]

25

主题

32

帖子

100

积分

注册会员

Rank: 2

积分
100
QQ
发表于 2017-10-31 15:58:21 | 显示全部楼层 |阅读模式 | 百度 
蚩尤子的评分为35--时间:2559-07-22 01:57:55.zhccool的评分为91--时间:2072-12-01 16:42:45,育龙团队的评分为15--时间:2483-10-05 11:08:55,水瓶吴思禄的评分为67--时间:2297-05-14 15:54:45,Symòn的评分为86--时间:2320-11-21 15:37:25,yxtgh的评分为76--时间:2585-12-24 18:35:15,
[size=1em]机器之心原创

机器之心编辑部



[quote][/quote]作为最早关注人工智能技术的媒体,机器之心在编译国外技术博客、论文、专家观点等内容上已经积累了超过两年多的经验。期间,从无到有,机器之心的编译团队一直在积累专业词汇。虽然有很多的文章因为专业性我们没能尽善尽美的编译为中文呈现给大家,但我们一直在进步、一直在积累、一直在提高自己的专业性。


两年来,机器之心编译团队整理过翻译词汇对照表「红宝书」,编辑个人也整理过类似的词典。而我们也从机器之心读者留言中发现,有些人工智能专业词汇没有统一的翻译标准,这可能是因地区、跨专业等等原因造成的。举个例子,DeepMind 的一篇论文中有个词汇为 differentiable boundary tree,当时机器之心的翻译为可微分界树,但后来有读者表示这样的译法如果不保留英文很难明白表达的意思且建议翻译为可微分边界树。


因此,我们想把机器之心内部积累的人工智能专业词汇中英对照表开放给大家,希望为大家写论文、中文博客、阅读文章提供帮助。同时,这也是一份开放的表单,希望越来越多的人能够提供增添、修改建议,为人工智能的传播助力。


项目地址:https://github.com/jiqizhixin/Artificial-Intelligence-Terminology


组织形式






读者在此项目中,可通过以上表盘查看自己想要了解的专业词汇。在单个首字母中,表格的组织形式为:英文/缩写、汉语、来源&扩展。


来源&扩展是对该词汇的注解,内容为机器之心往期的相关文章。例如下图所示的「算法」,我们关联到的三篇文章是《回归、分类与聚类:三大方向剖解机器学习算法的优缺点》和《机器学习算法附速查表》和《深度学习算法全景图:从理论证明其正确性》。因此,我们希望不仅能提供相对应的术语,同时还希望能为读者提供每一个术语的来源和概念上的扩展。但由于这一部分工作量较大,我们还将与读者共同推进这一部分扩展的进程。






准确性



本项目中所有英文专业词汇对照的中文都来自机器之心编译的文章和系列机器学习教科书(如周志华的《机器学习》和李航的《统计学习方法》等),我们力求在提供准确翻译的同时保留最常用的形式。同时,为了保证词汇翻译的准确性,我们将此项目向读者开源,并希望能与读者共同迭代术语的准确度。除此之外,我们还将为每一个词汇提供来源与扩展进一步提升词汇的置信度。


机器之心术语编译标准



因为该项目很多术语都是机器之心平常编译文章所积累的,所以我们首先需要向读者说明机器之心术语编译的标准。


1. 常见术语的编译标准


机器之心常见术语的编译首先会确保术语的正确性,其次再考虑术语的传播广度。例如常见术语。logistic regression,首先机器之心会保证该术语的准确度。我们常见 logistic regression 会翻译为逻辑回归,但中文「逻辑」与 logistic 的含义还是有些差别,因此我们并不太倾向于采用这种译法。在准确度的基础上,我们会考虑术语的传播广度。例如有学者建议可以将 logistic regression 译为对数几率回归,但鉴于该译法的传播度不广,看到中文并不会马上检索到对应英文和概念,所以我们最终在常见术语编译标准下将 logistic regression 译为 logistical 回归。机器之心在对常见术语编译时并不会保留英文,也不会做进一步说明。


2. 非常见术语的编译标准


机器之心在编译技术文章或论文时,常常会遇到非常见的术语。因为像论文那样的文章是在特定领域下为解决特定问题而规范化书写的,所以就会存在较多的非常见的术语。而机器之心在编译非常见术语时,唯一的标准就是准确性,通常我们也会保留英文。因为非常见术语通常是数学、神经科学和物理学等领域上的专业术语,机器之心会尽可能地借鉴其他领域内的译法和意义而确定如何编译。例如 fixed-point theorem,在参考数学的情况下,我们会更倾向于译为不动点定理,fixed-point 译为不动点而不是定点。


3. 歧义术语的编译标准


还有很多术语其实是有歧义的,而对于这一类词,机器之心的编译标准会根据语义进行确定,因此也会有一些误差。例如 bias 在描述神经网络层级单元时可以译为偏置项。而在描述训练误差和与叉验证误差间的关系或学习曲线时,bias 可以译为偏差。这样的例子还有很多,比如 Stationary 在马尔可夫模型中可译为稳态分布(Stationary distribution),在最优化问题中可译为驻点(Stationary point),而在涉及博弈论或对抗性训练时,其又可能表达为静态。


以上是机器之心大概编译术语的标准,虽然我们在常用术语的编译上错误率相对较少,但在非常见术语和歧义术语上仍然会出现一些错误。尤其是在非常见术语的编译上,没有特定的背景知识很容易在编译上出现误差。因此我们希望能与读者共同加强术语的编译质量。


词汇更新



本词汇库目前拥有的专业词汇共计 500 个,主要为机器学习基础概念和术语,同时也是该项目的基本词汇。机器之心将继续完善术语的收录和扩展阅读的构建。词汇更新主要分为两个阶段,第一阶段机器之心将继续完善基础词汇的构建,即通过权威教科书或其它有公信力的资料抽取常见术语。第二阶段机器之心将持续性地把编译论文或其他资料所出现的非常见术语更新到词汇表中。


读者的反馈意见和更新建议将贯穿整个阶段,并且我们将在项目致谢页中展示对该项目起积极作用的读者。因为我们希望术语的更新更具准确度和置信度,所以我们希望读者能附上该术语的来源地址与扩展地址。因此,我们能更客观地更新词汇,并附上可信的来源与扩展。


Letter A



Accumulated error backpropagation
累积误差逆传播
Activation Function
激活函数
Adaptive Resonance Theory/ART
自适应谐振理论
Addictive model
加性学习
Adversarial Networks
对抗网络
Affine Layer
仿射层
Affinity matrix
亲和矩阵
Agent
代理 / 智能体
Algorithm
算法
Alpha-beta pruning
α-β剪枝
Anomaly detection
异常检测
Approximation
近似
Area Under ROC Curve/AUC
Roc 曲线下面积
Artificial General Intelligence/AGI
通用人工智能
Artificial Intelligence/AI
人工智能
Association analysis
关联分析
Attention mechanism
注意力机制
Attribute conditional independence assumption
属性条件独立性假设
Attribute space
属性空间
Attribute value
属性值
Autoencoder
自编码器
Automatic speech recognition
自动语音识别
Automatic summarization
自动摘要
Average gradient
平均梯度
Average-Pooling
平均池化


Letter B



Backpropagation Through Time
通过时间的反向传播
Backpropagation/BP
反向传播
Base learner
基学习器
Base learning algorithm
基学习算法
Batch Normalization/BN
批量归一化
Bayes decision rule
贝叶斯判定准则
Bayes Model Averaging/BMA
贝叶斯模型平均
Bayes optimal classifier
贝叶斯最优分类器
Bayesian decision theory
贝叶斯决策论
Bayesian network
贝叶斯网络
Between-class scatter matrix
类间散度矩阵
Bias
偏置 / 偏差
Bias-variance decomposition
偏差-方差分解
Bias-Variance Dilemma
偏差 - 方差困境
Bi-directional Long-Short Term Memory/Bi-LSTM
双向长短期记忆
Binary classification
二分类
Binomial test
二项检验
Bi-partition
二分法
Boltzmann machine
玻尔兹曼机
Bootstrap sampling
自助采样法/可重复采样/有放回采样
Bootstrapping
自助法
Break-Event Point/BEP
平衡点


Letter C


Calibration
校准
Cascade-Correlation
级联相关
Categorical attribute
离散属性
Class-conditional probability
类条件概率
Classification and regression tree/CART
分类与回归树
Classifier
分类器
Class-imbalance
类别不平衡
Closed -form
闭式
Cluster
簇/类/集群
Cluster analysis
聚类分析
Clustering
聚类
Clustering ensemble
聚类集成
Co-adapting
共适应
Coding matrix
编码矩阵
COLT
国际学习理论会议
Committee-based learning
基于委员会的学习
Competitive learning
竞争型学习
Component learner
组件学习器
Comprehensibility
可解释性
Computation Cost
计算成本
Computational Linguistics
计算语言学
Computer vision
计算机视觉
Concept drift
概念漂移
Concept Learning System /CLS
概念学习系统
Conditional entropy
条件熵
Conditional mutual information
条件互信息
Conditional Probability Table/CPT
条件概率表
Conditional random field/CRF
条件随机场
Conditional risk
条件风险
Confidence
置信度
Confusion matrix
混淆矩阵
Connection weight
连接权
Connectionism
连结主义
Consistency
一致性/相合性
Contingency table
列联表
Continuous attribute
连续属性
Convergence
收敛
Conversational agent
会话智能体
Convex quadratic programming
凸二次规划
Convexity
凸性
Convolutional neural network/CNN
卷积神经网络
Co-occurrence
同现
Correlation coefficient
相关系数
Cosine similarity
余弦相似度
Cost curve
成本曲线
Cost Function
成本函数
Cost matrix
成本矩阵
Cost-sensitive
成本敏感
Cross entropy
交叉熵
Cross validation
交叉验证
Crowdsourcing
众包
Curse of dimensionality
维数灾难
Cut point
截断点
Cutting plane algorithm
割平面法


Letter D



Data mining
数据挖掘
Data set
数据集
Decision Boundary
决策边界
Decision stump
决策树桩
Decision tree
决策树/判定树
Deduction
演绎
Deep Belief Network
深度信念网络
Deep Convolutional Generative Adversarial Network/DCGAN
深度卷积生成对抗网络
Deep learning
深度学习
Deep neural network/DNN
深度神经网络
Deep Q-Learning
深度 Q 学习
Deep Q-Network
深度 Q 网络
Density estimation
密度估计
Density-based clustering
密度聚类
Differentiable neural computer
可微分神经计算机
Dimensionality reduction algorithm
降维算法
Directed edge
有向边
Disagreement measure
不合度量
Discriminative model
判别模型
Discriminator
判别器
Distance measure
距离度量
Distance metric learning
距离度量学习
Distribution
分布
Divergence
散度
Diversity measure
多样性度量/差异性度量
Domain adaption
领域自适应
Downsampling
下采样
D-separation (Directed separation)
有向分离
Dual problem
对偶问题
Dummy node
哑结点
Dynamic Fusion
动态融合
Dynamic programming
动态规划


Letter E



Eigenvalue decomposition
特征值分解
Embedding
嵌入
Emotional analysis
情绪分析
Empirical conditional entropy
经验条件熵
Empirical entropy
经验熵
Empirical error
经验误差
Empirical risk
经验风险
End-to-End
端到端
Energy-based model
基于能量的模型
Ensemble learning
集成学习
Ensemble pruning
集成修剪
Error Correcting Output Codes/ECOC
纠错输出码
Error rate
错误率
Error-ambiguity decomposition
误差-分歧分解
Euclidean distance
欧氏距离
Evolutionary computation
演化计算
Expectation-Maximization
期望最大化
Expected loss
期望损失
Exploding Gradient Problem
梯度爆炸问题
Exponential loss function
指数损失函数
Extreme Learning Machine/ELM
超限学习机


Letter F



Factorization
因子分解
False negative
假负类
False positive
假正类
False Positive Rate/FPR
假正例率
Feature engineering
特征工程
Feature selection
特征选择
Feature vector
特征向量
Featured Learning
特征学习
Feedforward Neural Networks/FNN
前馈神经网络
Fine-tuning
微调
Flipping output
翻转法
Fluctuation
震荡
Forward stagewise algorithm
前向分步算法
Frequentist
频率主义学派
Full-rank matrix
满秩矩阵
Functional neuron
功能神经元


Letter G



[table]

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x


可能是最好的文件格式转换网站
回复
百度搜狗360奇虎

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

快速回复 返回顶部 返回列表