模型介绍
百灵大规模语言模型是一种通用的语言模型,已通过生成式人工智能注册部署。经过万亿级标记的训练,目前使用的版本是百灵-Pro-1120。
左右滑动查看更多
语言理解能力
能应对日常对话的基本理解,但对隐喻和专业术语的处理较为生硬。
6.0
知识覆盖范围
掌握主流学科核心知识体系,但对前沿交叉学科覆盖有限。
8.6
推理能力
无法保持连贯推理链条,常出现因果倒置或数据误算。
6.3
模型比较
相关模型
Ling-1T
百灵LLM系列由蚂蚁集团百灵团队自主研发,在语义理解、指令执行和文本生成方面展现出卓越能力,能够高效处理涉及推理、知识、编程和数学的任务。
Finix-P1 (Thinking)
蚂蚁集团发布的金融领域法律硕士学位。
Ring-1T
百灵LLM系列由蚂蚁集团百灵团队自主研发,在语义理解、指令执行和文本生成方面展现出卓越能力,能够高效处理涉及推理、知识、编程和数学的任务。
Ring-1T-preview
百灵 LLM 系列由蚂蚁金服百灵团队自主研发。它在语义理解、指令遵循和文本生成方面表现出卓越的能力,能够有效地处理涉及推理、知识、编码和数学的任务。
Finix-P1 (Thinking)
蚂蚁金服集团发布的金融领域 LLM。
相关文档
WordPress.com 现已支持 AI 助手撰写和发布文章,还有更多功能
广受欢迎的网站托管和发布平台 WordPress.com 现已开始引入人工智能助手——这一举措或将重塑网络的呈现方式。该公司于周五宣布,将允许人工智能助手在用户网站上起草、编辑和发布内容,同时还能管理评论、更新和修正元数据,并通过标签和分类对内容进行整理。所有这些操作均通过一个界面进行控制,网站所有者只需使用自然语言命令说明其需求即可。凭借这些新功能,网站几乎可以完全由人工指导的AI代理来创建和运
Anthropic公司的实验性人工智能Claude在电子商务测试中完成了谈判和交易
随着人工智能的飞速发展,Anthropic上周五悄然启动了一项名为“Project Deal”的内部实验,展示了人工智能在电子商务领域的潜力。该实验让其人工智能模型Claude在封闭的市场环境中自主处理买卖及价格谈判,并涉及真实的金融交易。实验的核心是一个基于Slack构建的内部市场,Claude在其中同时担任买卖双方的谈判代表。它首先对69名员工进行了访谈,收集了他们的买卖意向及个性化指示,随后
DeepSeek Code 即将发布
随着人工智能技术的加速发展,DeepSeek正处于一个激动人心的关键时刻。这家人工智能公司近日透露,已获得超过700亿元的融资。公司管理层强调,将致力于开创性的人工智能研究,而非追求眼前的商业利益。这一战略转型表明,DeepSeek将全力投入新产品的开发,尤其是备受期待的DeepSeek Code。DeepSeek Code的规划已初具雏形,公司招聘页面上已发布多个相关职位,例如“Agent Ha
马斯克的Grok:1.5万亿参数与光标代码吸收——颠覆性突破还是虚张声势?
埃隆·马斯克终于开始行动了。在人工智能编程竞赛中,OpenAI和Anthropic正加速前进,而xAI似乎有些落后。马斯克曾多次表示要与Claude一较高下,尽管Grok4.X系列已多次更新,但其成果在理论上看似不错,实际应用中却未能达到预期,双方的差距几乎未见缩小。不过,这次他手中握有一张新牌。马斯克在X平台确认,Grok的新版本即将问世。 这款基础模型第九版的内部代号已确定,参数规模高达1.5
OpenAI 悄悄修改章程,以增加解雇阿尔特曼的难度
在2023年那场类似政变的事件之后,OpenAI通过更新公司章程,进一步巩固了对首席执行官萨姆·阿尔特曼的保护措施。最近公布的法庭文件显示,阿尔特曼的职位如今已牢不可破,针对外部干预或董事会内部试图罢免他的行为,设置了大幅提高的门槛。在埃隆·马斯克起诉OpenAI一案中,一位专家证人指出,这些变更是在公司向营利模式转型之际悄然进行的。与之前的简单多数表决规则不同,新政策为奥特曼提供了强有力的免遭解





首页
