当前位置：首页 > 科技赋能

电子科技大学陈建文！没有完美的大数据，现实世界都是小数据

时间：2024-05-22 19:03:35 科技赋能

电子科技大学视觉智能研究中心主任陈建文在国内AI人的印象中，陈建文是一位企业家，也是一位学者。

但他最在意的还是自己学者的身份——电子科技大学人工智能研究中心主任。

但很明显，他并不是一个严肃的学者，而是一个超然、豁达的学者。

这主要是因为他想得深、说得多。

因此，当我们第一次见面时，我们都被他的言论“吓到”了。

那是7月9日国内顶级人工智能创新峰会上，当时作为主办方特邀嘉宾的陈建文不时发出“骇人听闻”的断言。

半个月后，我们在CJ上再次见到他，于是就有了下面的对话。

又经过一周左右的零碎整理，终于写下了：支撑AI复兴希望的是人类对未来的向往。

在很多人的印象中，人工智能技术已有61年的历史，经历了三次兴衰。

历史已经过去，而它之所以还保留着复兴的希望，很大程度上取决于某些关键技术的不断升级和突破。

这些关键技术包括感知技术、深度卷积神经网络、大数据、模式识别等。

但在人工智能领域浸淫十几年的陈建文看来，事实并非如此。

他似乎有自己独特的判断。

科幻电影也是技术突破的驱动力。

“人工智能之所以能够长盛不衰或者不断复兴，首先是因为它是未来的趋势，是科技发展的大趋势，没有人能够抗拒这一点。

”就像我们从20世纪70年代、1980年代看的科幻电影，到2000年代的《阿凡达》，甚至近几年的《星际迷航》和《骇客帝国》。

基本上，每个人看到的未来都差不多，只是有细微的差别。

“此外，陈建文认为，原因只有一个，那就是人类对未来的向往。

正是这种向往，推动了技术的不断进步。

”想象一下，未来，会有机器人与人对话你和陪伴你。

你会做各种各样的事情——如果你看看我们今天看到的科幻电影，很多地方都描绘了这样一幅令人向往的画面。

“昨天下午我在四川参加了一个人工智能学术会议，一位与会者说：我们以前读过比尔·盖茨的书，他谈到的未来、他描述的东西，当时感觉像科幻小说，但今天看起来像科学”小说里，很多已经实现了。

”所以我认为，在这个时间点上，无论是三点起伏还是螺旋式上升，对于AI的未来都是有迹可循的。

“技术的发展往往有自己的轨迹和规则，每个时间点都会出现不同的技术。

随着计算能力、硬件条件等方面越来越完善，每个时间点的技术成果也会有所不同.“就像几年前或者十年前，我们谈论模式识别，后来我们谈论机器学习。

这些实际上是随着计算能力的增长和算法的突破而逐渐出现并逐渐实现的。

例如神经网络它已经被用来解决各种各样的问题，比如机器视觉、语音识别等，这些问题是传统的基于规则的编程很难解决的，因此，在陈建文看来，AI的复兴不仅仅是因为它。

一两项关键技术的延续和突破，更大的原因其实是人类对未来的向往，而人类对美好未来的向往和内心的渴望正在支撑着人工智能技术和各种应用的深入发展。

整个《哆啦A梦》就是虚拟世界的直播互动。

说到直播和互动，就不能不提到虚拟世界和现实世界的差距和界限。

在这里，我们会发现一个非常有趣的现象。

70 年代和 80 年代出生的人最喜欢的日本动画片之一是《机器猫》（现在称为《哆啦A梦》）。

结局是什么？有一天，主角从梦中醒来，发现自己的脑袋里卡着什么东西。

所谓的亚索、小晶等人，其实都是虚拟世界中的虚拟人物。

它们可以在天空中飞翔，打开任何一扇门，前往另一个地方。

这就是我们所看到的。

《黑客帝国》中看到的魔法与《盗梦空间》和《阿凡达》中描绘的场景似乎没有本质区别。

所以在我看来，技术将在未来很多年甚至未来几年继续发展。

唯一不变的，是人类对想象中未来的向往。

而这种向往，吸引了所有的研究人员、工程师、博士、资本都朝着这个方向努力。

“大家都认为这就是未来，我们必须实现那个目标。

至于如何实现这个目标，这是算法需要解决的问题。

所以我告诉朋友们，当你看现在的直播时，你应该逆向思考问题，比如我在上海，你在南京，只要连上直播，我就能看到你，我就在你旁边。

如果是VR直播呢？你会觉得我就在你身边，但那是完全不同的形式；如果未来是全息直播呢？广义上来说，所有的AR/VR都属于人工智能的范畴，其核心技术也是AI技术，这也是Facebook扎克伯格认为VR的原因。

应用程序进入普通人的生活至少还需要十年的时间，但它仍然在这个领域进行了重注。

“行业今年会讨论视频直播，今年会讨论VR，未来可能会讨论更多。

就像很多科幻电影里的场景一样，当你按下按钮的时候，我就会“嗖”的一声出现在你的房间里，就在你的旁边。

“然后聊天结束后，我说，‘兄弟，我回上海了。

’”我按下按钮，它就回来了。

“实际上，人们正在被传送吗？或许不是人类，但或许是出现在你身边的我的影像。

“未来，智能家居、音箱等产品一定是家庭的标配。

三十年前，人们对智能家居、智能音箱还没有成熟的概念，或者说没有想到这些会出现在日常生活中。

”但现在情况明显发生了变化，陈建文对于家居生活的智能产品一直抱有积极的态度，他认为未来智能家居和智能音箱必然会成为中国家庭的标配，而不是过于独立。

背后有完整的产业链。

“小时候，我们无法想象家里有一辆汽车，但现在，我们的孩子一出生，家里往往就已经拥有一辆或几辆汽车了！智能家居产品虽然还没有普及，但未来肯定会成为家庭的标配。

”从算法、环境等因素来看，智能家居和智能音箱都是接口设备，也不一定。

成为未来我们熟悉的形式。

”对于这一点，业界其实还有很大的想象空间。

智能家居、智能音箱等可能是音箱的形式，也可能只是墙上的按钮，甚至可能是机器人或虚拟人。

“想象一下，只要你站在家里，一个标准的全息美女就会出现在你的身边，她会和你打招呼，和你聊天，听你的指令。

那也是一个智能家居吧？就她了当你说话的时候，就意味着音箱和家居已经融为一体了。

”对于现在市场上流行的智能音箱产品，比如亚马逊的Echo、谷歌的Google Home、苹果的HomePod，以及小米的小爱同学、阿里的天猫精灵X1等，陈建文认为它们是一场革命，一场针对的革命。

传统音箱和家居的市场和理念有一句话：只要方向对了，无论路走多远，陈建文认为，核心点是商业技术和应用场景。

智能音箱的应用范围会非常广、非常大，但什么时候爆发，或者什么时候有需要，将是另一个大问题。

”目前中国的智能家居和智能音箱过于独立，背后没有产业链。

他们。

在这种情况下，最终市场的整合仍将是巨头们的事情，也只有他们才有相应的规模和实力。

“未来，任何一家能够完全使用智能音箱作为接口，整合家居一切的公司，就是未来。

“智能家居的核心在于它能做什么，而不是它看起来是什么样子。

陈建文认为，人工智能更多的是一种工具，比如如何帮助盲人看路，如何帮助别人快速找到东西。

人工智能还包括AR/VR”智能家居、智能音箱的行业背景和应用场景巨大。

技术的商业化需要一个过程，需要时间，才能形成完整的产业链，形成一个完整的东西。

我认为这是一个很好的观点。

“今天的音箱仍然有固定的形式，但理想情况下，或者将来，它们应该没有固定的形式。

它可能只是附在墙上的舞蹈。

你在房间里说一些东西，比如音乐，它就开始播放“这个东西可能与扬声器的形式无关（它是语音识别的一部分），它只是一个传感器，但不幸的是，现阶段我们还没有在中国的房屋中安装这种传感器。

“所以，中国关于智能家居的谈论在某种程度上过于概念化和不真实。

我在美国的家，在浴室里，我买这个房子的时候，人们就已经提前安装了湿度探测器、温度探测器，甚至还有语音传感器。

识别设备等。

您洗完澡后，再也不用担心家里的所有湿度、温度等调节问题。

那么，你认为这是一个智能家居吗？ “现在中国是怎么做到的？买个加湿器放在那里，就不用管它了。

欧美国家已经把智能固化到墙内的传感器里了。

”所以，目前所谓的智能音箱只是阶段性产品。

在人工智能大数据、云计算、智能算法的支持下，此类阶段性产品很快将迎来更大的发展机遇。

不存在完美的大数据。

现实世界充满了小数据。

研究人工智能的人都知道一个基本原理：数据越大、越全面，输出的结果就越准确。

但问题是我们永远无法找到理论上完整的大数据。

，所以业界有小数据、小样本学习，即推理和规则顺序。

两者的结合似乎是未来AI的重点。

“实事求是地说，我们很多人，甚至一些教授，对大数据不感兴趣，这种认识是错误的。

我在很多会议上都说过，大数据是什么意思？不是数据有多大，也不是数据有多大。

”数据是。

”我曾经和一位教授交谈过，他说，我们正在做三维全息术。

我每秒可以收集几千兆字节的数据。

你觉得我的数据大吗？别人说我一天收集了很多东西。

有很多感觉。

．． “其实，按照学术界的说法，大数据更多的是数据的维度。

“如果一个人只有一个维度，那么无论你有多大，你都只是一个人。

只有当你拥有许多不同的维度时，你才能成为一个丰富而精彩的人。

事实上，数据永远不可能是完整的。

”例如：你想了解我，所以你搜索并找到一些信息。

但是，您搜索的内容必须是子集。

然后另外一个人也搜索了，他搜索的也是一个子集。

您正在搜索的只是一个子集且不完整。

“但是当把一千人搜索到的数据结合起来时，我基本上可以根据一千人的数据确定这个人的基本情况。

”所以你看，不完整的子集越多，就越接近事实。

然而，核心点是你永远无法获得完整的数据。

世界上有没有完整的数据？怎么可能有完整的数据呢？ “任何事情深挖都是不完整的。

中国还有句老话，‘大道五十，天四十九’，也是这个意思。

”大数据的意义在于数据有很多维度。

如果数据本身没有维度，只有一维、二维、三维，那么大数据就没有意义。

当数据收集有很多维度、更多角度、更多收集来源时，随着时间的推移，我们往往可以得到一个统计意义上的概念。

这是第一级独立数据的结果。

“还有一种情况，你从网上搜集了很多资料，另外一个人也整理了很多资料，你只是把这些资料放在一起，最后得出一个结论。

这是第一步；第二步，根据这些信息，你需要根据你喜欢吃辣椒、踢球等特征进行预测和分析，你就能预测出这个人的性格应该是什么样的，你就会更进一步。

”正如人们常说的，小样本、小数据、大数据的学习，从我见过的所有样本来看，单靠采样是不可能全部收集到的，几千个人有几千张脸，任何样本都是。

小样本，任何数据都是小数据。

现在我们在互联网上看到的所有数据都是小数据集合成的大数据，小数据的内容聚合成一个大数据集成。

都是小数据，没有所谓的大数据，在研究收集中，我们得到的永远只是其中的一部分。

很多小数据，就会形成大数据，然后通过排序、预测、算法，得出一定的结论，这个能力目前我们讲的大数据最大的行业应用，就是规则推理。

”现实世界中不存在大数据。

你看到这个人，描述他，十个字、二十个字，都是小数据。

但是，当你从宏观的角度来看时，你不是衡量这种独立的人，而是描述这一类人的时候，它就是大数据。

“一切都是这样，当你测量、获取、真正收集数据的时候，数据已经被你固定成了小数据、小样本。

”人工智能可以解决多维度、多任务的学习。

有一个很大的未来。

当前的人工智能技术还无法达到其最终形态。

那么现阶段它的技术缺陷有哪些呢？ “我觉得是这样的。

就像愿景一样，我们所说的人工智能的第一个重大缺陷就是：无论你今天看到的所有场景、所有东西，你仍然不会觉得它与你相关。

人正是“就像你和机器人说话时，你能感觉到它是假的；当你和AlphaGo下棋时，你也能感觉到它只是一台机器。

“解决这个问题其实有两种不同的方法。

一种是让这个算法变得更好。

我需要有大量的数据，然后我会给你反馈。

这是人类不断接近的一种方法。

” “当前人工智能的另一个重大缺陷是，在一个维度上取得了巨大进步，但在多维度和真实场景下的技术潜力还有很长的路要走。

“比如说我们希望这个机器人有语音识别、图像识别，还有各种东西，包括业务逻辑、语义识别等等。

但是目前的现状是，多维人工智能领域的发展还处于起步阶段。

” “从目前的技术阶段来看，我们只达到了通用人工智能的初级水平，自动驾驶领域的竞争结果仍然是巨头。

在智能家居和智能音箱市场，这和现在的自动驾驶领域非常相似，我们看到特斯拉其实做得很好，那些大型传统主机厂现在只是沉默了。

他们的大动作，也并非像很多人想象的那样无所事事，无论是智能家居还是智能音箱，归根结底还是一个传统的家居行业，我们能说智能家居是一个互联网行业吗？就像自动驾驶一样，未来会发生什么，没有人能下定论。

“只要能提供自动驾驶的核心模块，就在市场上占有一席之地，竞争不会因为产品差异化而失败。

我们以汽车为例，我们说汽车很受欢迎，汽车市场也很受欢迎。

”够大了，但也没有看到全世界的汽车发动机和变速箱都是一样的。

”自动驾驶也有L1、L2、L3、L4级的。

L4当然很棒，也许L4要卖2万，我可以用买更便宜的，毕竟我需要的是它能上路，甚至可以。

“从这个意义上说，未来市场将足够大，没有一家公司能够独善其身。

而且一旦标准统一，我们会发现原来的巨头仍然是巨头。

“就像目前丰田等每年生产数千万辆汽车的主机厂一样，他们只是将其中一个组件连接到计算机系统，然后用自动驾驶模块替换它。

”这就是答案。

很多人疑惑：既然百度要造无人驾驶汽车，为什么还有那么多人投资自动驾驶呢？他们就不怕被无情碾压吗？ “这就是思维逻辑。

虽然已经有科技巨头押注自动驾驶，但这并不妨碍它。

这也是为什么自动驾驶初创公司获得投资的原因仍然层出不穷。

”虚拟重构和情感感知将为直播带来划时代的效益要改变未来世界，无论技术如何变化，仍然必须“以人为本”。

人工智能技术为人服务是核心关键。

把人重构成一个虚拟的世界，如何让这个虚拟的世界变得真实？人要有最基本的情感，但是如何解决这个问题呢？一是重构，二是情感感知。

“你现在打游戏的时候可能感觉不到，但是如果我说你身边站着范冰冰，你需要她和你互动，和你说话，和你眼神互动等等。

”那么，这是为了带来的另一个问题是，我们需要准确地识别动作、面孔和情绪，以实现真正的交互。

“也就是说，我不仅要认你的脸，还要认你的情绪感知。

只有把这些东西都放进去，你才能和范冰冰玩得开心。

”这就是我们亿联视频现在正在做的事情。

“如果想把真实的‘人’放入虚拟世界中，需要做两件事：一是把人重构进去，二是让人们追随他们的情绪、动作、表情、神态等。

我搬进去如果你能做到这两件事，那将是一个划时代的改变，“因为这样你一回家就会发现你可以和别人约会了。

他们是真实的人，而不是虚假的人。

能看到人，能??看到人的外表，也能感觉到人的情绪，这就是心灵的互动。

“这样的话，你今天看到的场景，包括视频会议，都会发生巨大的变化。

这也是我认为人工智能短期内可以期待的。

”在陈建文看来，人工智能在各个垂直领域都发挥着重要作用，机会就在那里，而且是巨大的。

例如：可以预见，一旦AI技术取得实质性突破，今天的社会、医疗、教育等将不再是在线教育，而是真正的教育、智能教育。

“你按一个按钮，老师就会教你的孩子弹钢琴，我只需要买一架钢琴，你的孩子坐在那里，老师不用到你家就可以指导孩子的手部动作。

这就像拿着钢琴一样。

” “同样，上完钢琴课，我们可以随时改学绘画或舞蹈。

”从上帝的角度来看人工智能的发展，陈建文相信这将是全人类的梦想。

“什么是更令人高兴的消息？谷歌告诉我们，明年我们可以活到一百岁，然后每个人都可以在我上面描述的愿景中做任何他们想做的事情。

”因此，对于AI这个行业，我只能说：工作够了！ “做AI的时候，不要幻想，不要喊叫，我不想成为资本方，我一天到晚都在讲人工智能可以立马改变人类，那是不可能的，资本想喊多少就喊多少，但经营公司的人一定要脚踏实地，坚持下去。

陈建文和他的小“大话”我曾经看过一篇文章，说有两种人可以改变世界。

：一个是科学家，另一个是工程师。

上一篇：耐克做出了一双可以自动系鞋带的黑科技鞋

下一篇：下一块美味的蛋糕！可穿戴首饰？

电子科技大学陈建文！没有完美的大数据，现实世界都是小数据相关文章