andrew ng机器学习中核函数一般形式的维度为什么是(n+d,d)的组合?_什么是百度信息流广告?


- #问答
  • 1、 andrew ng机器学习中核函数一般形式的维度为什么是(n+d,d)的组合?

    假设原始特征x和z都是n维的,核函数K(x,z)=(x.T*z+d)^2=sum(xixj)(zizj)+sum(sqrt(2d)*xi)(sqrt(2d)*zi)+d^2对应的映射后特征维度为(n+d,d)。由此我们可以只计算x和z内积的平方加上其他项,就等价于计算映射后特征的内积,时间复杂度大大降低。

  • 2、 什么是百度信息流广告?

    并不存在一种「百度信息流广告」,只有信息流广告和提供投放的平台。

    百度的信息流广告上线时间并不长,但是却发展迅速,其露出位置包括改版后的百度首页,手机百度,百度新闻等app的信息流内容中。

    相比微博、微信还有等信息流广告平台,百度的优势并不非常明显,其用户还是传统pc端的搜索用户,但是也是可以尝试投放。

  • 3、 英文单词“Reference”和“Cite”有什么区别?

    谢谢邀请!你能问这中问题,说明你学历不高让我来回答你这两个单词有什么不同,看到没第一个字母是R,第二个的第一个字母是C,你问我有什么区别,这不一目了然吗,字母都不一样肯定有区别,y(˙ᴗ.)耶~,这两字母什么意思?我初中毕业看不懂😂

  • 4、 如何看待NG吴恩达离开百度人工智能?

    百度首席科学家吴恩达(AndrewNg)发布公开信,宣布自己将从百度离职,开启自己在人工智能领域的新篇章。就像他自己说的和他之前也说过的一样,百度的人工智能团队或者相关领域都做得很好,接下来不管是不是他的存在都会做的还不差。但是在经历了在俩家其实有些相似的公司google和baidu之后,想要跳出来,感觉是要跳出商业公司的束缚。从技术积累上,吴恩达已经带领百度走上了一个至少很多国内科技企业难以望其项背的高度。

    另外看到这个的时候突然想,现在的所谓人工智能感觉并没有一些很有趣很多的东西了。更准确的算法,更好的营销效果,就像苹果产品换代一样性能提升或者加了一个颜色,但其实并不激动人心了。所有公司说人工智能的时候都在做图像,自然语言然后知识图谱什么的。我想,他是想去做一点激动人心的事情吧。就离开百度这件事本身,我们和大家所了解到的信息都是一样的,也没有更多的料可爆。我们从公开信中也可以总结下信息:我还有很多项目想做,但因公司限制没精力或者无法去做,因此辞职了。

    那么百度人工智能接下来如何发展?对于大公司百度,这个的确不是啥好事。李彦宏刚把人工智能作为百度最重要的方向,就出了“大帅”辞职的事情。对于吴恩达这样的人才,绝对不是因为钱太少出走的。因为他要多少钱,李彦宏也会毫不犹豫的给他一个满意的数。百度人工智能团队目前有1300人,吴恩达的离职,百度人工智能团队肯定有一批人出来创业,一批被阿里、腾讯以及硅谷其他巨头挖走分食,老板离职对团队伤害肯定非常大,就看接下来的人能不能hold住了。百度这些年频频换帅且几无建树,百度不但朝中无大将而且外来和尚也敲不好钟,在错过整个移动互联网之后现在似乎也在机器学习领域开始迷茫了!

    此前百度还推出了包括小度机器人、度秘等在内的AI应用,从研发体系到底层技术再到业务应用,过去三年是百度AI战略从雏形到成型的三年,吴恩达功不可没。正是因为此,吴恩达的离开对于百度而言,堪称一大损失。如果吴恩达不离开百度,必然还有更多贡献,并且与普通人才不同,随着AI的爆发,门槛颇高的AI领域技术人才本来就稀缺,更何况吴恩达这样的全球顶尖人才,真的是凤毛麟角,说其价值等身黄金也不夸张。然而,天下没有不散的筵席,没有人能保证终身为一家公司效力,联合创始人离开公司比比皆是,更何况是吴恩达这样的顶级科学家——他有太多选择,科学家AI创业方兴未艾,被百度对手科技公司猎取也有可能。

    近年来,百度人事调动频繁。原副总裁李明远因涉嫌经济问题被驱赶;原微软资深副总裁陆奇担任首席运营官,围绕深度学习、增强现实和图像识别等技术重组公司业务;高级副总裁王劲也辞去自动驾驶事业部(L4)总经理一职;而此次,吴恩达的离开对百度无疑又将是一场动荡。陆奇上任后,百度业务方面就发生了一系列变动。陆奇表示,百度在引领新一代人机交互平台上拥有巨大的机会,可以推断,吴恩达的离职或许跟陆奇大刀阔斧改造百度有关。

    对于未来的百度而言,人工智能才刚刚开始。这或许对百度的人工智能战略来说,是一个新的开始。李彦宏在接受采访时,曾透露了对于人工智能的规划,他认为人工智能其实对任何一个产业,任何一个行业,任何一个公司都会有很大影响,对于百度来说更是。未来,人工智能的发展,也会是百度非常核心的竞争力,对未来百度长久的高速发展、包括收入和利润方面的发展都会有巨大的推动力。

  • 5、 吴恩达表示「AI的下一个发展方向,从大数据转向小数据」,你同意他的观点吗?

    实际上现在很多大数据领域的老师都在带领团队从事“小数据”的研究,这也是高校老师寻求创新突破的一个重要方向,而随着大数据在行业领域的落地应用,数据问题进一步突出,如何能够利用相对有限的数据来完成预测和决策,更具有现实价值。

    在大数据发展的初期,大家几乎都在追求“大数据”,似乎大数据能够解决一切问题,而早期由于互联网领域积累了大量的数据,在这种背景下,大数据确实解决了很多问题,很多高校老师也积极推动了大数据的产业应用,这个期间不论是对于企业,还是对于老师和学生来说,都是黄金期。

    对于企业来说,通过引入大数据技术,构建数据中台,基于数据和大算力来训练各种模型,以此来推动业务创新,这确实带来了显著的效果,这个过程中,很多老师也披挂上阵,走进了互联网大厂。

    对于学生来说,在这个大数据的黄金时期,创新点可以说是“无处不在”,在相关性理论的推动下,只要结果够好,完全可以不解释很多模型上的问题,或者说这根本无法解释,所以很多同学都以调参侠来调侃自己。

    但是随着数据中台推动业务上升的能力在减弱,大数据本身的“大耗能”,也受到了很多诟病,这也导致不少老师重新回归科研,重新思考大数据下一个阶段的创新出口。如果仅仅靠大数据和大算力来推动创新,这无疑是一条不归路,很多大厂正是基于算力和数据的优势,把众多小团队推进了墙角。

    总体上来说,现在很多科研工作者开始重视小数据的价值,这是对于前期过于关注大数据的一个修正,在特定领域,尤其是工业场景下,大数据未必有实际意义,高价值的小数据样本往往价值更高,模型也更透明,更容易理解。

    最后,如果有大数据相关的问题,欢迎与我交流探讨。

  • 6、 深度学习技术具体怎么理解?

    现在深度学习在机器学习领域是一个很热的概念,不过经过各种媒体的转载播报,这个概念也逐渐变得有些神话的感觉:例如,人们可能认为,深度学习是一种能够模拟出人脑的神经结构的机器学习方式,从而能够让计算机具有人一样的智慧;而这样一种技术在将来无疑是前景无限的。那么深度学习本质上又是一种什么样的技术呢?

    深度学习是什么

    深度学习是机器学习领域中对模式(声音、图像等等)进行建模的一种方法,它也是一种基于统计的概率模型。在对各种模式进行建模之后,便可以对各种模式进行识别了,例如待建模的模式是声音的话,那么这种识别便可以理解为语音识别。而类比来理解,如果说将机器学习算法类比为排序算法,那么深度学习算法便是众多排序算法当中的一种(例如冒泡排序),这种算法在某些应用场景中,会具有一定的优势。

    深度学习的“深度”体现在哪里

    论及深度学习中的“深度”一词,人们从感性上可能会认为,深度学习相对于传统的机器学习算法,能够做更多的事情,是一种更为“高深”的算法。而事实可能并非我们想象的那样,因为从算法输入输出的角度考虑,深度学习算法与传统的有监督机器学习算法的输入输出都是类似的,无论是最简单的LogisticRegression,还是到后来的SVM、boosting等算法,它们能够做的事情都是类似的。正如无论使用什么样的排序算法,它们的输入和预期的输出都是类似的,区别在于各种算法在不同环境下的性能不同。

    那么深度学习的“深度”本质上又指的是什么呢?深度学习的学名又叫深层神经网络(DeepNeuralNetworks),是从很久以前的人工神经网络(ArtificialNeuralNetworks)模型发展而来。这种模型一般采用计算机科学中的图模型来直观的表达,而深度学习的“深度”便指的是图模型的层数以及每一层的节点数量,相对于之前的神经网络而言,有了很大程度的提升。

    深度学习也有许多种不同的实现形式,根据解决问题、应用领域甚至论文作者取名创意的不同,它也有不同的名字:例如卷积神经网络(ConvolutionalNeuralNetworks)、深度置信网络(DeepBeliefNetworks)、受限玻尔兹曼机(RestrictedBoltzmannMachines)、深度玻尔兹曼机(DeepBoltzmannMachines)、递归自动编码器(RecursiveAutoencoders)、深度表达(DeepRepresentation)等等。不过究其本质来讲,都是类似的深度神经网络模型。

    既然深度学习这样一种神经网络模型在以前就出现过了,为什么在经历过一次没落之后,到现在又重新进入人们的视线当中了呢?这是因为在十几年前的硬件条件下,对高层次多节点神经网络的建模,时间复杂度(可能以年为单位)几乎是无法接受的。在很多应用当中,实际用到的是一些深度较浅的网络,虽然这种模型在这些应用当中,取得了非常好的效果(甚至是thestateofart),但由于这种时间上的不可接受性,限制了其在实际应用的推广。而到了现在,计算机硬件的水平与之前已经不能同日而语,因此神经网络这样一种模型便又进入了人们的视线当中。

    “2012年6月,《纽约时报》披露了GoogleBrain项目,吸引了公众的广泛关注。这个项目是由著名的斯坦福大学机器学习教授AndrewNg和在大规模计算机系统方面的世界顶尖专家JeffDean共同主导,用16000个CPUCore的并行计算平台训练一种称为“深层神经网络”(DNN,DeepNeuralNetworks)”

    从GoogleBrain这个项目中我们可以看到,神经网络这种模型对于计算量的要求是极其巨大的,为了保证算法实时性,需要使用大量的CPU来进行并行计算。

    当然,深度学习现在备受关注的另外一个原因,当然是因为在某些场景下,这种算法模式识别的精度,超过了绝大多数目前已有的算法。而在最近,深度学习的提出者修改了其实现代码的Bug之后,这种模型识别精度又有了很大的提升。这些因素共同引起了深层神经网络模型,或者说深度学习这样一个概念的新的热潮。

    深度学习的优点

    为了进行某种模式的识别,通常的做法首先是以某种方式,提取这个模式中的特征。这个特征的提取方式有时候是人工设计或指定的,有时候是在给定相对较多数据的前提下,由计算机自己总结出来的。深度学习提出了一种让计算机自动学习出模式特征的方法,并将特征学习融入到了建立模型的过程中,从而减少了人为设计特征造成的不完备性。而目前以深度学习为核心的某些机器学习应用,在满足特定条件的应用场景下,已经达到了超越现有算法的识别或分类性能。

    深度学习的缺点

    深度学习虽然能够自动的学习模式的特征,并可以达到很好的识别精度,但这种算法工作的前提是,使用者能够提供“相当大”量级的数据。也就是说在只能提供有限数据量的应用场景下,深度学习算法便不能够对数据的规律进行无偏差的估计了,因此在识别效果上可能不如一些已有的简单算法。另外,由于深度学习中,图模型的复杂化导致了这个算法的时间复杂度急剧提升,为了保证算法的实时性,需要更高的并行编程技巧以及更好更多的硬件支持。所以,目前也只有一些经济实力比较强大的科研机构或企业,才能够用深度学习算法,来做一些比较前沿而又实用的应用。

  • 7、 自学数据挖掘可以找到工作吗?

    楼上已经有这么多的回答都很棒了,讲学什么?怎么学?以及自己的经验,现在我来聊聊可以找到工作么?

    先放一下我个人的BG,我也是二本,然后考到国内某985学校,之前是学电信科技的,也就是可以简单理解为解方程焊电路的,然后研究生期间跟导师做地质信号处理简单理解为挖石油的,目前在国内a字头的公司做数据挖掘与分析。

    总结以下两点:

    1、数据挖掘是你的兴趣么?每个人做一件事情都有动机,或者听说这个东西牛逼,或者旁人说好找工作,然后今天就做这个,我个人认为,真正要把数据挖掘作为你的职业,已经是需要毅力和对这个领域的浓厚兴趣的(是否真的感兴趣,建议先在这个领域做到60%,比如去阿里云参加天池大赛,进入前20等等,你自然对这个事情有新的看法和认知了)。

    2、互联网时代,BG真心不那么重要,如果你能像1中所说进前20,至少去阿里云面试应该是没问题的,你的学历只会是简历第一轮筛选时候的短板。证明自己才是王道。

    3、有了如上两点,相信你这个问题,自然就有解决方案了,不要迷茫,喜欢就去追,想做就作出你的成果,所有你想要的都是你努力的附加成果。

    以上,加油。

Related Content: