切换到宽版
  • 18阅读
  • 2回复

[智能应用]抹黑华为抄袭别人大模型,我们用事实说话! [复制链接]

上一主题 下一主题
在线huozm32831

UID: 329002

精华: 1097
职务: 超级斑竹
级别: 玉清道君
 

发帖
111505
金币
375
道行
19523
原创
29308
奖券
17828
斑龄
197
道券
10550
获奖
0
座驾
 设备
EOS—7D
 摄影级
专家级认证
在线时间: 22341(小时)
注册时间: 2007-11-29
最后登录: 2025-07-11

这两天的事再次证明,有些群体抹黑华为无所不用其极。拿着一个模棱两可的东西硬生生把华为抄袭推上了热搜。说白了,就是要用一盆脏水否定华为所有科技研发的努力,只有华为的黑料才能压低一些企业越来越泛滥的负面舆情。

那今天我们就来聊一聊两边的大模型之间的事,我在之前的视频有说过,大模型这个东西靠技术、靠数据、靠训练,日积月累才能做成优秀的大模型,这种叫底座型大模型。所有一蹴而就、或者忽然横空出世的大模型绝大多数都是所谓的蒸馏型大模型。说白了,就是把一些底座型大模型的某些能力优化了,变成偏科学生,某个能力很强,其他能力很弱。
从有大模型开始,我们国内真正有做底座型大模型的都是有钱、有技术,而且愿意长期投入的公司,就那么几个,分别是百度文心大模型、阿里的通义大模型、华为的盘古大模型、腾讯的混元大模型、科大讯飞的星火大模型,还有现在互联网行业新秀字节跳动的云雀大模型发展十分迅猛。其他的大模型,包括DeepSeek还有某个公司吹了一波牛逼以后一点动静都没有的大模型基本都是蒸馏型大模型。

今天的主角是华为的盘古大模型和阿里的通义大模型。现在一些帖子拿了一些云里雾里的数据就说盘古大模型抄袭。首先,盘古大模型早在2021年就推出了初代盘古大模型,但是一直都是闭源的,也就是前几天才宣布部分开源。但是一些研究者只用了几天就得出这样的结论,说明研究的过程本身就是十分草率的。
另一方面,阿里也是最早进行大模型研发的企业,阿里的大模型是2023年8月才宣布开源的。大模型开源是什么意思呢?就是源代码、参数权重、训练数据等核心资源完全公开,允许开发者自由使用、修改和再分发。
所以,当一个大模型开源以后,很多没有那么强的资金和技术的企业或者个人,就可以进行借鉴、蒸馏或者本地部署。所以,在2023年8月以后,华为的盘古大模型借鉴通义大模型的一些训练技术或者大模型思路是完全没问题。

至于说完全抄袭,这从本质上就做不到。因为两个大模型的方向就不一样,盘古大模型更多是工业大模型,它聚焦政务、金融、工业等垂直领域。反正在一些高精尖的工业领域,在军工、在宇宙探测等方面其实都有华为盘古大模型的身影。至少在这一块,阿里的通义大模型是不具备的,这种能力在中国,只有盘古大模型有。
因为阿里的通义大模型更注重数学能力、代码能力、语言能力和工具调动的能力。因为阿里通义大模型是比较早开源的底座型大模型,所以当前市面上绝大多数主流的大模型都可以看到通义大模型的身影,这都很正常,这就是开源大模型的意义。

开源大模型能促进行业进步,但是对开源公司来说,它吸引全球开发者参与改进,加速技术迭代,帮助企业实现技术领先。但是呢,像DeepSeek这些蒸馏型大模型开源,由于它很多低频关联的知识都被过滤了,所以知识库比较单一,就很容易被污染而陷入思维混乱。所以,总的来说,蒸馏型大模型在未来仍然能还是很难和底座型大模型竞争的。
说了这么多,大家应该心里有个底了。大家应该也知道在互联网上到底是谁一直在抹黑华为,因为技术不行,就需要用舆论的方式来进行企业段位的强行平权。怎么说呢,假大空不会因为给别人破假大空的脏水而变得高大上。
充电宝事件已经实锤了,大量的客观数据也已经说明了手机真实的销量,未来或许某些保险公司的员工也会泄露一些车真正的保费和出险率数据,那时候一些车的真实销量也会实锤。总之,互联网是一滩浑水,但是未来一次又一次潮水褪去,大家就会慢慢知道,谁在裸泳。
山庄提示: 道行不够,道券不够?---☆点此充值☆
 
  




    
在线jjybzxw

UID: 551814


发帖
167724
金币
273165
道行
2004
原创
2404
奖券
2775
斑龄
35
道券
1005
获奖
0
座驾
设备
摄影级
在线时间: 38174(小时)
注册时间: 2008-10-01
最后登录: 2025-07-12
只看该作者 沙发  发表于: 07-06
这段话深入探讨了华为盘古大模型与阿里通义大模型之间的争议,并分析了大模型的分类、开源的意义以及企业间的竞争态势。以下是对这段话的几点总结和分析:

1. 大模型分类:
   - 底座型大模型:需要长期技术、数据和训练积累,代表企业有百度、阿里、华为、腾讯和科大讯飞等。
   - 蒸馏型大模型:基于底座型大模型优化特定能力,知识库较单一,容易陷入思维混乱。

2. 开源的意义:
   - 开源大模型意味着源代码、参数权重、训练数据等核心资源完全公开,允许自由使用、修改和再分发。
   - 开源促进行业进步,吸引全球开发者参与改进,加速技术迭代,帮助企业实现技术领先。

3. 华为盘古大模型与阿里通义大模型:
   - 盘古大模型聚焦政务、金融、工业等垂直领域,在军工、宇宙探测等领域有应用。
   - 通义大模型注重数学、代码、语言能力和工具调动能力,是较早开源的底座型大模型。

4. 抄袭争议:
   - 盘古大模型2021年推出初代,之前一直闭源,近期部分开源。
   - 通义大模型2023年8月开源,之后其他企业借鉴其技术是正常现象。
   - 两个大模型方向不同,不存在完全抄袭的可能性。

5. 企业竞争与舆论抹黑:
   - 一些群体利用模棱两可的信息抹黑华为,试图用负面舆论否定其科技研发努力。
   - 技术不行的企业可能通过舆论手段强行与技术领先的企业平权。

6. 互联网舆论与真相:
   - 互联网舆论复杂,但随着客观数据的披露,真相会逐渐浮出水面。
   - 未来更多真实数据的披露会揭示一些企业的真实状况。

这段话提醒我们,在互联网舆论中要保持理性和客观,不要轻易被片面信息所左右。要认识到开源大模型对行业进步的积极作用,同时也要警惕一些企业利用舆论进行不正当竞争的行为。作为消费者和观察者,我们应关注客观数据和事实,理性看待企业间的竞争和争议。
如何不发帖就快速得到金币道行
 
在线姜谷粉丝

UID: 1569053

精华: 2
级别: 玉清道君

发帖
144180
金币
263582
道行
20030
原创
756
奖券
185
斑龄
0
道券
0
获奖
0
座驾
设备
摄影级
在线时间: 16767(小时)
注册时间: 2012-06-21
最后登录: 2025-07-12
只看该作者 板凳  发表于: 07-07
以事实回应华为大模型抄袭质疑
近期,网络上出现华为盘古大模型抄袭的质疑声,实则是毫无根据的抹黑,以下将用事实进行回应。

华为官方声明
7月7日,盘古ProMoE技术开发团队正式发布官方声明。声明明确指出,盘古ProMoE开源模型是基于华为自家的升腾(Ascend)硬件平台开发、训练的基础大模型,并非基于其他厂商模型进行增量训练的产物。华为方面强调,该模型在架构设计和技术特性上均有关键创新1。

技术创新成果
在技术层面,华为创新性提出分组混合专家模型(MoGE)架构,这是全球首个面向升腾硬件平台设计的同规格混合专家模型。该架构的核心优势在于有效解决了大规模分布式训练过程中的负载均衡难题,从而显著提升了整体的训练效率。对于更多技术细节,官方建议参考已披露的升腾生态竞争力系列技术报告12。

坚持的理念
华为团队始终坚持开放创新的理念,尊重第三方的知识产权,并积极提倡包容、公平、开放、团结和可持续的开源理念。他们感谢全球开发者与合作伙伴对盘古大模型的关注和支持,并高度重视开源社区的建设性意见。华为希望通过盘古大模型的开源,与志同道合的伙伴一起探索并不断优化模型能力,共同推动技术的突破与产业的落地6。

过往也存在无端抹黑华为的情况,2024年就有一博主公开手写信,为自2019年以来多次抹黑华为一事道歉,其曾造谣“华为雇水军恶心小米和小米用户”“华为打压OPPO”“华为让上面全网封杀苹果发布会”等内容,严重损害了华为公司的商誉,也严重扰乱了网络公共秩序8。所以此次所谓的“抄袭质疑”也极有可能是毫无根据的抹黑。
如何不发帖就快速得到金币道行
 
我有我可以
快速回复
限120 字节
认真回复加分,灌水扣分~
 
上一个 下一个