可商业化，最强开源文本生成代码模型！Code Llama重磅发布

186 0

8月25日凌晨，全球社交、科技巨头Meta（Facebook、Instagram等母公司）在官网正式开源了，文本生成代码模型Code Llama。（开源地址：https://github.com/facebookresearch/codellama）

据悉，Code Llama是基于Meta前不久发布的，最强开源大语言模型Llama 2之上开发而成，提供基础代码、专门针对Python开发和基于自然语言指令微调的，70亿、130亿、340亿三种参数模型。允许企业、个人开发者使用此模型，进行商业化。

Meta表示，Code Llama在代码任务上的表现，优于目前所有开源代码模型。Code Llama支持 Python、C++、Java、PHP、Typescript (Javascript)、C#和Bash等主流编程语言，可根据自然文本或代码直接生成代码，例如，给我写一个斐波那契序列函数的代码。

Code Llama简单介绍

Code Llama是基于Llama 2大语言模型，再通过特定代码数据预训练、微调而成。除了支持文本或代码生成代码之外，还可用于代码的调试并支持目前所有主流开发语言。

Code Llama提供70亿、130亿和340亿三种参数模型，每个模型都使用了5000亿tokens代码数据训练而成。基础模型和指令模型经过了中间填充文本 (FIM) 功能的训练，允许将代码插入到现有代码中，这意味着它们可以支持开箱即用的代码完成任务。

Code Llama 模型提供了高达100,000 个上下文标记的稳定生成。所有模型均在 16,000 个标记的序列上进行训练，并在最多100,000 个标记的输入上显示出改进。

这意味着，开发人员在进行大型代码模型测试、调优时，可以将其全部输入到Code Llama中进行测试。

Code Llama还针对Python编程推出了Code Llama Python模型。是在 Python 代码的 1000亿标记上进行微调。

Python是代码生成方面最具基准测试的语言，并且Python 和 PyTorch 在AI 社区中发挥着重要作用，所以，推出了针对Python的代码模型。

Code Llama - Instruct 是 Code Llama 针对自然文本指令微调的模型，该模型支持自然文本输入和输出。

如果你想使用文本生成代码，Meta建议你使用该模型，因为Code Llama - Instruct已经过数据微调理解自然文本更好并且生成的代码更符合开发人员要求。

资源消耗方面，70亿参数模型可在单个GPU上运行。340亿参数模型可返回最佳结果并提供更好的编程辅助，但资源消耗更大。

所以，对于个人开发者、中小型企业来说，70亿、130亿参数的模型效率更高、资源消耗更少，适合低延迟的任务，例如，进行实时代码开发。

Code Llama性能评测

为了针对现有解决方案测试 Code Llama 的性能，Meta使用了两个流行的编码基准：HumanEval 和 Mostly Basic Python 编程 (MBPP)。

HumanEval 测试模型根据文档字符串完成代码的能力，MBPP测试模型根据描述编写代码的能力。

测试结果显示，Code Llama的表现优于开源、特定代码的Llama，并且优于 Llama 2。例如，Code Llama 340亿参数模型在 HumanEval上得分为 53.7%，在 MBPP 上得分为 56.2%，与ChatGPT性能相当。

本文素材来源Meta官网，如有侵权请联系删除

推荐阅读

世界人工智能大会开幕：马斯克谈AIGC
重磅！GPT-4 API，全面开放使用！
OpenAI：4年内控制超级智能，提升ChatGPT等安全
亲测：ChatGPT 国内就能使用,全面支持中文
白嫖党福利：国内免费访问ChatGPT网站整理
ChatGPT 镜像网站
国内ChatGPT如何使用，ChatGPT中文使用指南，一分钟玩转国内类ChatGPT产品
ChatGPT是如何工作的？
ChatGPT助力Midjourney解锁惊喜创意
ChatGPT多场景应用之基本应用
引爆海外市场：ChatGPT带来定制化营销活动的奇迹
ChatGPT的潘多拉魔盒-Prompt
ChatGPT能否取代传统律师职业
年入100万的ChatGPT提示工程师
非结构化数据处理（RWS）
使用ChatGPT快速阅读一本书
如何在ChatGPT中显示图片
ChatGPT论文降重-从97%到5%
| 产品体验|
以上的截图（模板）均来源于我们的AI助手: 知否AI问答，一个基于清华大学 KEG 实验室和智谱 AI 公司于 2023 年共同训练的语言模型 GLM-130B 开发的平台，它提供专业、高速、稳定的文案生成与问答功能。微信扫码一键登录，无需其他复杂验证，新用户可免费试用。
欢迎体验ChatGPT-知否AI问答，为您提供专业、高速、稳定的文案生成与问答服务！
产品支持60余个应用场景，包括论文助手、公司文案、营销文案、多语言翻译

靠AI做Labubu动态壁纸，已赚¥8000+（附教程）

最近泡泡玛特的 Labubu 毫无疑问是当红辣子鸡，火得不得了，这个月不仅反复出现在各个平台的热榜，还让不少人赚到到了第一桶金！可不是倒买倒卖，更不是定制娃衣、贴纸这种二创实体周边，不仅路径长，还容易被判侵权。而是一个大家极可能忽略的赛道——手机动态壁纸，是的，当下 Labubu 的动态壁纸成了

599 0

软件开发因AI有了根本性转变？刚刚，带火“Vibe Coding”风潮的前 OpenAI 大佬 Andrej Karpathy，在 YC 的演讲刷屏出圈！这是一场足以改变你对编程、对大模型、对未来软件形态理解的深度分享。 Karpathy 一开场就掷地有声地说： “软件正在再次发生根本性的变化。

79 0

人工智能

AI可以被定义为是变革性的风口。今天大会的主题是AI，没有想到有一天我会在混沌的平台上讲AI。有点意思的是，我之前还在说，在语言概念上，“混沌”可能正是当下市场在接入AI 以后呈现出来的那个最初形态。我们知道，凡是一定数量的个体都拥有一个共同的名字，它们就有一个共同的“理念”或者“形式”。我们用

167 0

对论文写作而言，开题是 “定方向、立框架、避风险” 的关键环节 —— 它不是简单提交一份文档，而是通过系统性论证，确认研究课题的可行性、价值性与科学性，为后续写作避免 “方向跑偏”“无内容可写” 等问题。对于新手来说，清晰理解开题的核心逻辑与流程，能极大降低后续写作的难度。一、先搞懂：什么是论文开

17 0