实时:微软打造 13 亿参数小型 LLM AI 模型,号称实际效果胜于千亿参数 GPT-3.5
微软日前最近发布了一款13亿参数的语言模型phi-1,采用“教科书等级”
(资料图片)
IT之家 6 月 27 日消息,AI 模型盲堆体积实际上效果并不见得更好,更多要看训练数据的质量,微软日前最近发布了一款 13 亿参数的语言模型 phi-1,采用“教科书等级”的高品质资料集训练而成,据称“实际效果胜于千亿参数的 GPT 3.5”。
IT之家注意到,该模型以 Transformer 架构为基础,微软团队使用了包括来自网络的“教科书等级”数据和以 GPT-3.5 经过处理的“逻辑严密的内容”,以及 8 个英伟达 A100 GPU,在短短 4 天内完成训练。
微软团队表示,比起增加模型的参数量,通过提高模型的训练数据集质量,也许更能强化模型的准确率和效率,于是,他们利用高质量数据训练出了 phi-1 模型。在测试中,phi-1 的分数达到 50.6%,比起 1750 亿参数的 GPT-3.5(47%)还要好。
微软表示,phi-1 接下来会在 HuggingFace 中开源,而这不是微软第一次开发小型 LLM,此前,他们打造一款 130 亿参数的 Orca,使用了 GPT-4 合成的数据训练而成,表现也同样比 ChatGPT 更好。
目前关于 phi-1 的论文已经在 arXiv 中发布,可以在这里找到论文的相关内容。
关键词:
微软日前最近发布了一款13亿参数的语言模型phi-1,采用“教科书等级”
近日,数码博主数码闲聊站首次曝光了RedmiNote系列下半年的新机,据称
1、当地居民约定俗称,故名。2、。本文到此分享完毕,希望对大家有所帮
城关区一年级新生入学报名问题解答第一期问题一:我已经参加了城关区6
总督和巡抚是什么官?1、总督和巡抚合称“督抚”,都是从明朝开始设置的
关于在家做家常菜有哪些菜谱的内容,包含家常菜有哪些好吃的菜谱一星期
导读:为落实“优一”纲要以及“十四五”规划提出的“加快建设全链条、
北京时间6月27日,女篮亚洲杯继续开打,中国女篮半场战至33-20新西兰,
文章来源:证券之星1 恒工精密(创业板)申购代码:301261股票代码:3012
近日,府谷县高梁村大棚种植基地的16棚香瓜陆续成熟,大棚内一派繁忙景
当下关于亚马逊EchoShow15智能显示器评测,相信很多小伙伴都不是很了解
本报讯近日,市公安局八桥派出所联合八桥镇政府、妇联开展各村禁毒宣传
鑫科材料60025506月27日在投资者关系平台上答复了投资者关心的问题投资
深圳市发展改革委主任郭子平26日介绍,深圳市轨道交通五期已于近日顺利
1、价格与泡沫混凝土容量,抗压强度有关,泡沫配料也有很大的差别。2、
爱旭股份公告,考虑到国内外市场变化,基于公司实际经营及财务情况、资
1 致尚科技(创业板)申购代码:301486股票代码:301486发行价格:57 6
高级经济师考试难吗?考试有什么特点?计划报考的小伙伴,快来了解吧,
券商评级是指证券公司的分析师,通过分析上市公司的财务潜力、财务指标
全科医生助诊包提升村卫生室设备水平近年来,柏乡县实施“行走的医院”