实时：微软打造 13 亿参数小型 LLM AI 模型，号称实际效果胜于千亿参数 GPT-3.5-热讯测绘网

实时：微软打造 13 亿参数小型 LLM AI 模型，号称实际效果胜于千亿参数 GPT-3.5

来源： IT之家

2023-06-28 01:14:32

(资料图片)

IT之家 6 月 27 日消息，AI 模型盲堆体积实际上效果并不见得更好，更多要看训练数据的质量，微软日前最近发布了一款 13 亿参数的语言模型 phi-1，采用“教科书等级”的高品质资料集训练而成，据称“实际效果胜于千亿参数的 GPT 3.5”。

▲ 图源 Arxiv

IT之家注意到，该模型以 Transformer 架构为基础，微软团队使用了包括来自网络的“教科书等级”数据和以 GPT-3.5 经过处理的“逻辑严密的内容”，以及 8 个英伟达 A100 GPU，在短短 4 天内完成训练。

▲ 图源 Arxiv

微软团队表示，比起增加模型的参数量，通过提高模型的训练数据集质量，也许更能强化模型的准确率和效率，于是，他们利用高质量数据训练出了 phi-1 模型。在测试中，phi-1 的分数达到 50.6%，比起 1750 亿参数的 GPT-3.5（47%）还要好。

▲ 图源 Arxiv

微软表示，phi-1 接下来会在 HuggingFace 中开源，而这不是微软第一次开发小型 LLM，此前，他们打造一款 130 亿参数的 Orca，使用了 GPT-4 合成的数据训练而成，表现也同样比 ChatGPT 更好。

目前关于 phi-1 的论文已经在 arXiv 中发布，可以在这里找到论文的相关内容。

关键词：

实时：微软打造 13 亿参数小型 LLM AI 模型，号称实际效果胜于千亿参数 GPT-3.5

微软日前最近发布了一款13亿参数的语言模型phi-1，采用“教科书等级”

2023-06-28

速讯：Redmi Note 13首曝：无塑料支架极窄柔性OLED屏幕

近日，数码博主数码闲聊站首次曝光了RedmiNote系列下半年的新机，据称

2023-06-28

宝华山

1、当地居民约定俗称，故名。2、。本文到此分享完毕，希望对大家有所帮

2023-06-28

2023兰州城关区一年级新生报名问题解答（第一期）-每日速递

城关区一年级新生入学报名问题解答第一期问题一：我已经参加了城关区6

2023-06-28

总督是什么官职(总督和巡抚是什么官?)

总督和巡抚是什么官?1、总督和巡抚合称“督抚”，都是从明朝开始设置的

2023-06-28

在家做家常菜有哪些菜谱|全球快资讯

关于在家做家常菜有哪些菜谱的内容,包含家常菜有哪些好吃的菜谱一星期

2023-06-28

深交所•创享荟③｜数智赋能，助力制造业企业高质量发展

导读：为落实“优一”纲要以及“十四五”规划提出的“加快建设全链条、

2023-06-28

李梦10分4助攻！带队单节轰出32-7小高潮

北京时间6月27日，女篮亚洲杯继续开打，中国女篮半场战至33-20新西兰，

2023-06-28

当前热门：港股三大指数齐下挫！“中字头”普跌，电力股逆市冲高

文章来源：证券之星1 恒工精密(创业板)申购代码：301261股票代码：3012

2023-06-28

府谷县高梁村：瓜果飘香产业旺铺就“甜蜜”致富路_焦点简讯

近日，府谷县高梁村大棚种植基地的16棚香瓜陆续成熟，大棚内一派繁忙景

2023-06-28

亚马逊Echo Show15智能显示器评测

当下关于亚马逊EchoShow15智能显示器评测，相信很多小伙伴都不是很了解

2023-06-27

八桥镇加强禁毒宣传员业务培训今日看点

本报讯近日，市公安局八桥派出所联合八桥镇政府、妇联开展各村禁毒宣传

2023-06-27

鑫科材料：公司严格按照《上海证券交易所股票上市规则》等相关规定履行信息披露义务

鑫科材料60025506月27日在投资者关系平台上答复了投资者关心的问题投资

2023-06-27

深圳市轨道五期已开工总投资1952亿元

深圳市发展改革委主任郭子平26日介绍，深圳市轨道交通五期已于近日顺利

2023-06-27

轻质泡沫混凝土多少钱一立方泡沫混凝土多少钱一方_即时看

1、价格与泡沫混凝土容量，抗压强度有关，泡沫配料也有很大的差别。2、

2023-06-27

爱旭股份：终止境外发行全球存托凭证事项-环球通讯

爱旭股份公告，考虑到国内外市场变化，基于公司实际经营及财务情况、资

2023-06-27

打新必看 | 6月28日两只新股申购，值得打吗？环球实时

1 致尚科技（创业板）申购代码：301486股票代码：301486发行价格：57 6

2023-06-27

高级经济师考试难度及考试特点，速来了解>_微资讯

高级经济师考试难吗？考试有什么特点？计划报考的小伙伴，快来了解吧，

2023-06-27

每日资讯：券商今日金股：4份研报力推一股（名单）

券商评级是指证券公司的分析师，通过分析上市公司的财务潜力、财务指标

2023-06-27

全科医生助诊包提升村卫生室设备水平-全球资讯

全科医生助诊包提升村卫生室设备水平近年来，柏乡县实施“行走的医院”

2023-06-27

相关阅读

实时：微软打造 13 亿参数小型 LLM AI 模型，号称实际效果胜于千亿参数 GPT-3.5

速讯：Redmi Note 13首曝：无塑料支架极窄柔性OLED屏幕

宝华山

2023兰州城关区一年级新生报名问题解答（第一期）-每日速递

总督是什么官职(总督和巡抚是什么官?)

在家做家常菜有哪些菜谱|全球快资讯

深交所•创享荟③｜数智赋能，助力制造业企业高质量发展

李梦10分4助攻！带队单节轰出32-7小高潮

当前热门：港股三大指数齐下挫！“中字头”普跌，电力股逆市冲高

府谷县高梁村：瓜果飘香产业旺铺就“甜蜜”致富路_焦点简讯

亚马逊Echo Show15智能显示器评测

八桥镇加强禁毒宣传员业务培训今日看点

鑫科材料：公司严格按照《上海证券交易所股票上市规则》等相关规定履行信息披露义务

深圳市轨道五期已开工总投资1952亿元

轻质泡沫混凝土多少钱一立方泡沫混凝土多少钱一方_即时看

爱旭股份：终止境外发行全球存托凭证事项-环球通讯

打新必看 | 6月28日两只新股申购，值得打吗？环球实时

高级经济师考试难度及考试特点，速来了解>_微资讯

每日资讯：券商今日金股：4份研报力推一股（名单）

全科医生助诊包提升村卫生室设备水平-全球资讯

资讯

热点

相关阅读

实时：微软打造 13 亿参数小型 LLM AI 模型，号称实际效果胜于千亿参数 GPT-3.5

速讯：Redmi Note 13首曝：无塑料支架极窄柔性OLED屏幕

宝华山

2023兰州城关区一年级新生报名问题解答（第一期）-每日速递

总督是什么官职(总督和巡抚是什么官?)

在家做家常菜有哪些菜谱|全球快资讯

深交所•创享荟③｜数智赋能，助力制造业企业高质量发展

李梦10分4助攻！带队单节轰出32-7小高潮

当前热门：港股三大指数齐下挫！“中字头”普跌，电力股逆市冲高

府谷县高梁村：瓜果飘香产业旺 铺就“甜蜜”致富路_焦点简讯

亚马逊Echo Show15智能显示器评测

八桥镇加强禁毒宣传员业务培训 今日看点

鑫科材料：公司严格按照《上海证券交易所股票上市规则》等相关规定履行信息披露义务

深圳市轨道五期已开工 总投资1952亿元

轻质泡沫混凝土多少钱一立方 泡沫混凝土多少钱一方_即时看

爱旭股份：终止境外发行全球存托凭证事项-环球通讯

打新必看 | 6月28日两只新股申购，值得打吗？ 环球实时

​高级经济师考试难度及考试特点，速来了解>_微资讯

每日资讯：券商今日金股：4份研报力推一股（名单）

全科医生助诊包提升村卫生室设备水平-全球资讯

资讯

热点

快讯

2023兰州城关区一年级新生报名问题解答（第一期）-每日速递

深交所•创享荟③｜数智赋能，助力制造业企业高质量发展

亚马逊Echo Show15智能显示器评测

府谷县高梁村：瓜果飘香产业旺铺就“甜蜜”致富路_焦点简讯

八桥镇加强禁毒宣传员业务培训今日看点

深圳市轨道五期已开工总投资1952亿元

轻质泡沫混凝土多少钱一立方泡沫混凝土多少钱一方_即时看

打新必看 | 6月28日两只新股申购，值得打吗？环球实时

高级经济师考试难度及考试特点，速来了解>_微资讯