微软打造 13 亿参数小型 LLM AI模型，效果胜于千亿参数 GPT-3.5

2023-06-27 09:44:04 IT之家

(资料图片)

IT之家 6 月 27 日消息，AI 模型盲堆体积实际上效果并不见得更好，更多要看训练数据的质量，微软日前最近发布了一款 13 亿参数的语言模型 phi-1，采用“教科书等级”的高品质资料集训练而成，据称“实际效果胜于千亿参数的 GPT 3.5”。

▲ 图源 Arxiv

IT之家注意到，该模型以 Transformer 架构为基础，微软团队使用了包括来自网络的“教科书等级”数据和以 GPT-3.5 经过处理的“逻辑严密的内容”，以及 8 个英伟达 A100 GPU，在短短 4 天内完成训练。

▲ 图源 Arxiv

微软团队表示，比起增加模型的参数量，通过提高模型的训练数据集质量，也许更能强化模型的准确率和效率，于是，他们利用高质量数据训练出了 phi-1 模型。在测试中，phi-1 的分数达到 50.6%，比起 1750 亿参数的 GPT-3.5（47%）还要好。

▲ 图源 Arxiv

微软表示，phi-1 接下来会在 HuggingFace 中开源，而这不是微软第一次开发小型 LLM，此前，他们打造一款 130 亿参数的 Orca，使用了 GPT-4 合成的数据训练而成，表现也同样比 ChatGPT 更好。

目前关于 phi-1 的论文已经在 arXiv 中发布，可以在这里找到论文的相关内容。

本地游成假期出游主基调 中秋关键词赏月星空温泉等度假酒店

戴兵呼吁推动国际社会在叙利亚反恐问题上加强合作

城商行进军“跨境理财通” 上海银行入围

青少年科技素养提升计划在农村培训逾万教师 超31万小学

从“节能减排”到“绿色发展” 民航局印发《“十四五”

“小份菜”引领新风尚

粤港澳大湾区年货班列开行数量创历史新高

应急管理部启动低温雨雪冰冻灾害Ⅳ级应急响应

虎虎生威振精神——来自澳门的新年祝福

城市对青年更友好 青年在城市更有为

香港资审会裁定57名选委会当然委员登记有效

拿什么来保护数据安全？基层数据安全体系建设待提升

粤澳警方联合打掉一跨境有组织犯罪团伙

香港大学首推“顶尖运动员入学计划”

香港应科院将拓宽在内地的发展

香港入境处：2021年访港旅客同比跌97.4%

香港警方共拘捕162人涉嫌违反香港国安法

微软打造 13 亿参数小型 LLM AI模型，效果胜于千亿参数 GPT-3.5

单日净投放创二季度来最高 央行护航年中流动性 焦点要闻

江永推广烟夹机节约三成用工今年预计可完成烤烟收购任务5.6万担

韩国在野党批评政府就日本排污入海表态

豪横的藏式婚礼！我是真的馋这一堆嫁妆啊......-环球百事通

天天观热点：晶华新材实控人刚转让5.99%又拟减持3% 净利连续两年降幅达80%毛利率不到20%

新消息丨Faker谈UZI复出，坦言没关注他的比赛，格局真的小了，不如许秀

环球快播：“街球霸王”巡回赛北京站落幕

五谷是指哪五谷视频_五谷是指哪五谷

半夜脚抽筋怎么办（睡觉脚抽筋是怎么回事）

环球速看：荣耀v10电池健康查询

天天速递！【金融机构债发行结果】23中信建投CP013票面利率为2.4500%

多点亏损41亿再闯港股，“物美系”亲儿子如何独立行走？

显示器2k是什么意思

福建福州：端午节上演中华龙舟大赛

圣诺医药|时讯

环球速看：B2B2C商城系统源码怎么选择？加速度jsudo

华脉科技(603042.SH)副总经理王晓甫累计减持公司约1%股份 世界关注

6月26日河南地区聚合氯化铝价格基本平稳 报道

河南省农业科学院关于诚招“猪口蹄疫O型抗体检测试纸条”合作经营企业的公告

九华旅游： 公司目前没有人工智能相关应用-环球速讯

唐人神：公司生猪养殖长期发展目标是年出栏1000万头生猪

自治区十四届人大常委会召开第12次主任会议

世界简讯:在家自己做豆腐脑用什么点_如何在家自己做豆腐脑

电报隐私相册id_相册id

荣耀play3指纹解锁在哪里设置 荣耀play3有指纹解锁

【网络中国节·端午】“外来娃”乐学端午知识 传承弘扬中华优秀传统文化|环球速讯

天天热议:北京第三座大悦城设立警务室！来看民警端午都忙些啥

高考查分场面代入感太强 男生601分激动得满屋蹦跳：高中三年考最好的一次|天天实时

「展览有意思36」中国美术馆馆长吴为山导赏，这些压箱底宝贝别错过（上）_环球热推荐

天天热门:全国183个国家气象站日最高气温突破月极值

最新：端午假期首日，各地景区人气值咋样？数据来了

洛阳男性包皮过长怎么办？洛阳正规男科医院做包皮手术多少钱？ 当前通讯

西藏自治区市场监督管理局原党组书记果果接受纪律审查和监察调查

越南公安部：多乐省警局遇袭事件与美国恐怖组织有联系|环球信息

报志愿时，请认准湖北这132所高校！涉及荆州7所_每日快看

100个简单的科技小制作手工 100个简单的科技小制作-快看

工业级路由器设置（工业级路由器）_每日报道

世界快消息！厦门开展逾40场端午主题活动邀您“粽”情消费

南宁应急救护在身边 为赛事保驾护航|最新快讯

杨毅调侃保罗加盟勇士心情：保罗说自己很鸡冻 但你看他像鸡冻吗|全球关注

含蓄的表达生日（含蓄的表达生日快乐）-世界快看点

避难层防烟设置要求_避难层设置要求|环球视讯

银川烧烤店爆炸事故7名伤员生命体征平稳

退役军人事务部来泰兴调研优待清单长效管理情况 环球热资讯

东风风行S500及东风雪铁龙C4世嘉怎么样

每日看点!跟队记者：久恩托利即将离开那不勒斯，尤文对他很感兴趣

极目远眺的意思是什么_极目远眺的释义

世界简讯:日照九仙山旅游攻略-九仙山旅游攻略

靖黎高速房建工程顺利通过竣工验收

抢鸭子，包粽子……简阳端午节日氛围浓 当前讯息

青平：遏制形式主义蔓延，减轻基层负担 今亮点

快资讯丨孩子我为什么打你阅读答案2015年_孩子我为什么打你阅读答案

20多次刷新纪录！国之重器“海洋石油201”有多牛？

毕业典礼遇大雨，这位校长扔掉3500字讲稿15秒钟划重点

荞头菜如何做菜 荞头菜如何做菜吃

五月端午吃粽子赛龙舟纪念屈原

速讯：2023年4月中国计算机集成制造技术出口金额统计分析

世界微动态丨国金证券：今年基建总体表现如何？后续开工如何演绎？

世界讯息：2023年第一季度“中国好人榜”在洛发布 应天门首次为“中国好人”而开

李湘新恋情曝光！戴情侣围巾为他开路太宠溺，他长得憨实身材又高又壮

新资讯：生产成本乘以成本利润率等于什么（什么是生产成本什么是利润率）

世界时讯：桌面上的ie图标不见了怎么办_按照步骤操作就能显示了

本地游成假期出游主基调中秋关键词赏月星空温泉等度假酒店

青少年科技素养提升计划在农村培训逾万教师超31万小学

城市对青年更友好青年在城市更有为

单日净投放创二季度来最高央行护航年中流动性焦点要闻

华脉科技(603042.SH)副总经理王晓甫累计减持公司约1%股份世界关注

6月26日河南地区聚合氯化铝价格基本平稳报道

九华旅游：公司目前没有人工智能相关应用-环球速讯

荣耀play3指纹解锁在哪里设置荣耀play3有指纹解锁

【网络中国节·端午】“外来娃”乐学端午知识传承弘扬中华优秀传统文化|环球速讯

高考查分场面代入感太强男生601分激动得满屋蹦跳：高中三年考最好的一次|天天实时

洛阳男性包皮过长怎么办？洛阳正规男科医院做包皮手术多少钱？当前通讯

南宁应急救护在身边为赛事保驾护航|最新快讯

杨毅调侃保罗加盟勇士心情：保罗说自己很鸡冻但你看他像鸡冻吗|全球关注

退役军人事务部来泰兴调研优待清单长效管理情况环球热资讯

抢鸭子，包粽子……简阳端午节日氛围浓当前讯息

青平：遏制形式主义蔓延，减轻基层负担今亮点

荞头菜如何做菜荞头菜如何做菜吃

世界讯息：2023年第一季度“中国好人榜”在洛发布应天门首次为“中国好人”而开

“2023山东夏日消费季”在烟台启动每日热闻

夏至丨流光半夏美好日长

全国“新时代政法楷模个人”曹修斌：用忠诚诠释初心用行动践行使命

环渤海动力煤价格环比上行5元/吨观速讯

什么是半导体材料的压阻效应什么是半导体材料即时

steam创意工坊在哪那个软件_steam创意工坊在哪微动态

宁德时代：与福特公司合作项目正按计划进行中今日看点

美国记者盛赞中国2米13小将：潜力巨大是一块璞玉_环球最新

云顶之弈静水监狱阵容推荐一览云顶之弈静水监狱阵容有哪些

沪指维持弱势震荡两市成交连破万亿回调是布局良机？｜晨会博弈

增开46列客车全国铁路7月1日起实行新的列车运行图_焦点热闻

自行束修以上吾未尝无诲焉的意思（自行束修以上吾未尝无诲）天天新资讯

天天观焦点：武汉蓝电获中信证券等36家机构网络调研：公司毛利率较高有较强降价优势