注册
环信即时通讯云

环信即时通讯云

单聊、群聊、聊天室...
环信开发文档

环信开发文档

Demo体验

Demo体验

场景Demo,开箱即用
RTE开发者社区

RTE开发者社区

汇聚音视频领域技术干货,分享行业资讯
技术讨论区

技术讨论区

技术交流、答疑
资源下载

资源下载

收集了海量宝藏开发资源
iOS Library

iOS Library

不需要辛辛苦苦的去找轮子, 这里都有
Android Library

Android Library

不需要辛辛苦苦的去找轮子, 这里都有

AutoGPT太火了,无需人类插手自主完成任务,GitHub2.7万星

OpenAI 的 Andrej Karpathy 都大力宣传,认为 AutoGPT 是 prompt 工程的下一个前沿。 近日,AI 界貌似出现了一种新的趋势:自主人工智能。 这不是空穴来风,最近一个名为 AutoGPT 的研究开始走进大众视野。特斯拉前 AI...
继续阅读 »

OpenAI 的 Andrej Karpathy 都大力宣传,认为 AutoGPT 是 prompt 工程的下一个前沿。


近日,AI 界貌似出现了一种新的趋势:自主人工智能

这不是空穴来风,最近一个名为 AutoGPT 的研究开始走进大众视野。特斯拉前 AI 总监、刚刚回归 OpenAI 的 Andrej Karpathy 也为其大力宣传,并在推特赞扬:「AutoGPT 是 prompt 工程的下一个前沿。」



不仅如此,还有人声称 ChatGPT 已经过时了,AutoGPT 才是这个领域的新成员。



项目一经上线,短短几天狂揽 27K + 星,这也侧面验证了项目的火爆。



GitHub 地址:github.com/torantulino…

问题来了,AutoGPT 到底是什么?它是一个实验性的开源应用程序,展示了 GPT-4 语言模型的功能。该程序由 GPT-4 驱动,可以自主实现用户设定的任何目标。



具体来说,AutoGPT 相当于给基于 GPT 的模型一个内存和一个身体。有了它,你可以把一项任务交给 AI 智能体,让它自主地提出一个计划,然后执行计划。此外其还具有互联网访问、长期和短期内存管理、用于文本生成的 GPT-4 实例以及使用 GPT-3.5 进行文件存储和生成摘要等功能。AutoGPT 用处很多,可用来分析市场并提出交易策略、提供客户服务、进行营销等其他需要持续更新的任务。

正如网友所说 AutoGPT 正在互联网上掀起一场风暴,它无处不在。很快,已经有网友上手实验了,该用户让 AutoGPT 建立一个网站,不到 3 分钟 AutoGPT 就成功了。 期间 AutoGPT 使用了 React 和 Tailwind CSS,全凭自己,人类没有插手。看来程序员之后真就不再需要编码了。



之后该用户补充说,自己的目标很简单,就是用 React 创建一个网站。提出的要求是:创建一个表单,添加标题「Made with autogpt」,然后将背景更改为蓝色。AutoGPT 成功的构建了网站。该用户还表示,如果给 AutoGPT 的 prompt 更多,表现会更好。

图源:twitter.com/SullyOmarr/…

接下里我们再看一个例子。假装自己经营一家鞋公司,给 AutoGPT 下达的命令是对防水鞋进行市场调查,然后让其给出 top5 公司,并报告竞争对手的优缺点 :



首先,AutoGPT 直接去谷歌搜索,然后找防水鞋综合评估 top 5 的公司。一旦找到相关链接,AutoGPT 就会为自己提出一些问题,例如「每双鞋的优缺点是什么、每款排名前 5 的防水鞋的优缺点是什么、男士排名前 5 的防水鞋」等。

之后,AutoGPT 继续分析其他各类网站,并结合谷歌搜索,更新查询,直到对结果满意为止。期间,AutoGPT 能够判断哪些评论可能偏向于伪造,因此它必须验证评论者。



执行过程中,AutoGPT 甚至衍生出自己的子智能体来执行分析网站的任务,找出解决问题的方法,所有工作完全靠自己。

结果是,AutoGPT 给出了 top 5 防水鞋公司的一份非常详细的报告,报告包含各个公司的优缺点,此外还给出了一个简明扼要的结论。全程只用了 8 分钟,费用为 10 美分。期间也完全没有优化。



这个能够独立自主完成任务的 AutoGPT 是如何运行的呢?我们接着来看。

AutoGPT:30 分钟内构建你自己的 AI 助手

作为风靡互联网的 AI 智能体,AutoGPT 可以在 30 分钟内完成设置。 你就可以拥有自己的 AI,协助完成任务,提升工作效率。

这一强大的 AI 工具能够自主执行各种任务,设置和启动的简便性是一大特征。在开始之前,你需要设置 Git、安装 Python、下载 Docker 桌面、获得一个 OpenAI API 密钥。

克隆存储库

首先从 GitHub 中克隆 AutoGPT 存储库。



使用以下命令导航到新建文件夹 Auto-GPT。



配置环境

在 Auto-GPT 文件夹中,找到.env.template 文件并插入 OpenAI API 密钥。接着复制该文件并重命名为.env。



安装 Python 包

运行以下命令,安装需要的 Python 包。



运行 Docker

运行 Docker 桌面,不需要下载任何容器,只需保证程序处于激活状态。



运行 AutoGPT



执行以下命令,运行 AutoGPT。



设置目标**

AutoGPT 虽是一个强大的工具,但并不完美。为避免出现问题,最好从简单的目标开始,对输出进行测试,并根据自身需要调整目标,如上文中的 ResearchGPT。

不过,你如果想要释放 AutoGPT 的全部潜力,需要 GPT-4 API 访问权限。GPT-3.5 可能无法为智能体或响应提供所需的深度。

AgentGPT:浏览器中直接部署自主 AI 智能体

近日,又有开发者对 AutoGPT 展开了新的探索尝试,创建了一个
可以在浏览器中组装、配置和部署自主 AI 智能体的项目 ——AgentGPT。** 项目主要贡献者之一为亚马逊软件工程师 Asim Shrestha,已在 GitHub 上获得了 2.2k 的 Stars。



AgentGPT 允许你为自定义 AI 命名,让它执行任何想要达成的目标。自定义 AI 会思考要完成的任务、执行任务并从结果中学习,试图达成目标。如下为 demo 示例:HustleGPT,设置目标为创立一个只有 100 美元资金的初创公司。



再比如 PaperclipGPT,设置目标为制造尽可能多的回形针。



不过,用户在使用该工具时,同样需要输入自己的 OpenAI API 密钥。AgentGPT 目前处于 beta 阶段,并正致力于长期记忆、网页浏览、网站与用户之间的交互。

GPT 的想象力空间还有多大,我们继续拭目以待。

参考链接: medium.com/@tsaveratto…


作者:机器之心
链接:https://juejin.cn/post/7221089899281580091
来源:稀土掘金
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
收起阅读 »

GPT-4自我修复!国外小哥开发神级「金刚狼」,无限自我Debug

【新智元导读】继 GPT-4 超强进化后,现在还能自我修复。国外网友开发一个「金刚狼」项目,能够自动修复 Python 中的 bug,并运行代码。 要问程序员,一天中最烦的时候是什么? 那一定是给写好的程序 Debug 了。而现在,这种局面要得到改善了! 国...
继续阅读 »

【新智元导读】继 GPT-4 超强进化后,现在还能自我修复。国外网友开发一个「金刚狼」项目,能够自动修复 Python 中的 bug,并运行代码。


要问程序员,一天中最烦的时候是什么?


那一定是给写好的程序 Debug 了。而现在,这种局面要得到改善了!



国外一名叫 BioBootloader 的开发者基于 GPT-4 搞了一个叫「金刚狼」的项目,能够自我修复 Python 脚本。


从名字就能看出来,这项目主打一个「自我愈合」。通过 GPT 识别代码中的错误,并提供修改,直至程序顺利运行。


不过,「金刚狼」目前只能用在 Python 上。


这项目已经在 GitHub 上收揽了 1.2k 星,108 个 Fork。



金刚狼?金刚狼!


BioBootloader 表示,用「金刚狼」运行你的程序,只要一崩溃,GPT-4 就会自动编辑,然后给出出错的原因。


哪怕码农写了一大堆 Bug,也没事。「金刚狼」会反复运行,直到一切 Bug 都被 De 掉。



GPT-4 想必大家都不陌生。这是由 OpenAI 开发的多模态人工智能语言模型。


BioBootloader 在推特上的演示视频中,展示了「金刚狼」的具体使用方式。



视频中,开发者先写了个简单的四则运算代码,然后故意把其中一些部分写错。



(正确的)


比方说,把结尾的 return result 随便改成 return res,而 res 没有定义,于是就出错了。


小哥还把减法部分的代码删掉了,就是上方的 substract_numbers。这样一来,下面 calculate 那里就一定会报错。因为 subtract 没有定义了。



(错误的)


之后直接运行「金刚狼」即可,GPT 生成的部分会出现在右侧。



可以看到,「金刚狼」快速识别出了错误,并且附上了解释。


「脚本中没有定义 subtract_numbers.


res 这个变量没有定义,应该用 result 代替。」



不光给了建议,「金刚狼」还直接把改好的代码附上了。红色是应该删掉的部分,绿色是添加的部分。


实际上,「金刚狼」是一个封装器,它负责运行程序,捕捉错误信息,再把这些错误发送给 GPT-4,询问 GPT 代码出了什么问题。


像 GPT-4 这种 LLM(即大型语言模型),是用自然语言「编程」的,而这些指令被视为 prompts。


「金刚狼」所实现的功能很大一部分要归功于精心编写的提示,阅读这些提示就可以更好的理解整个过程。


目前该项目已经发布在了 GitHub 上。小哥也是贴心的给出了设置上的要求。



不止是 Python


在 GitHub 上,BioBootloader 发布了自己未来的计划,「金刚狼」的功能会越来越全面、强大。



「目前的版本只是我花了几个小时搞得一个原型产品。未来还会有很多可能的延展,同时欢迎大家一起来开发。」




  • 添加标志来定制使用方法,例如在运行改变的代码前要求用户确认。




  • 对 GPT 的编辑格式进行进一步的迭代。目前,GPT 在缩进方面有点困难,但我确信这一点可以得到改善。




  • 一套有问题的文件的例子,我们可以在上方的测试进行提示,以确保其可靠性,并衡量改进的如何。




  • 多个文件 / 代码库——向 GPT 发送堆栈跟踪中出现的所有文件




  • 对大文件更好地处理,即我们是否应该只向 GPT 发送相关的类 / 函数?




  • 扩展到 Python 以外的编程语言




从上面那个简单的例子可以看出来,这个脚本还是未来可期的。


毕竟,总不能让用别的语言工作的码农们看着智能 Debug Python 的「金刚狼」眼红呀。


参考资料:


twitter.com/bio_bootloa…


hackaday.com/2023/04/09/…


作者:新智元
链接:https://juejin.cn/post/7221089899280138299
来源:稀土掘金
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
收起阅读 »

推荐几个可以免费使用的ChatGPT工具

在ChatGPT相关API推出之后,各种工具如雨后春笋一般层出不穷,这篇文章就列举一些日常使用到的工具。 工具列表 myreader.io myReader主页 这款工具的作者是@madawei2699,github主页地址为t.co/adJBYWbjkF,...
继续阅读 »

在ChatGPT相关API推出之后,各种工具如雨后春笋一般层出不穷,这篇文章就列举一些日常使用到的工具。


工具列表


myreader.io


myReader主页


myReader主页


这款工具的作者是@madawei2699,github主页地址为t.co/adJBYWbjkF,…



  • 在线读取任意网页内容包括视频(YouTube),并根据这些内容回答你提出的相关问题或总结相关内容

  • 支持读取电子书与文档(支持PDF、EPUB、DOCX、Markdown、TXT),并根据这些内容回答你提出的相关问题或总结相关内容

  • 定时发送每日热榜新闻,无论新闻是中文还是其他语言,它都能使用chatGPT用中文自动总结新闻的内容,方便快速获取热点新闻信息

  • 支持 prompt 模版,能根据消息历史记录的上下文回答你的问题,甚至能和你玩游戏

  • 支持多国语音交互(英文、中文、德语与日语),它会根据你的语言使用相关语言的声音来回答你的问题,从而帮助你训练外语能力,可以理解为它是你的私人外教


具体功能演示可以参考我的AI阅读助手


chatpdf


ChatPDF主页


ChatPDF主页


这个可以看作是一个PDF辅助阅读的工具,用户上传自己的PDF之后,可以以对话的方式与工具进行交互,快速获取PDF文件的内容。


ChatPaper


专注于“科研狗”的工具,通过ChatGPT实现对论文进行总结,帮助“科研人”进行论文初筛(目前不支持针对论文内容进行对话)。


ChatPaper主页


ChatPaper主页


另外相关的工具还有润色工具、审稿工具、审稿回复工具


最后,这篇文章——ChatGPT应用开发小记中提到的基于chatGPT的应用类型的分类也有借鉴意义。


原理


之前准备写一篇专门介绍上述工具类的原理介绍(其实ChatGPT的 插件——chatgpt-retrieval-plugin),但是后来查看了几个项目的源码之后发现,这类工具的主要原理其实比较直观:



  • 解析相关输入为文本

  • 将文本分句后获取句子的embedding(这一步目前处理的处理方式大都是根据长度截断)并存储至数据库

  • 用户输入转换为embedding,并在数据库中召回相关性最高的句子集合

  • 将召回的句子与用户输入句子组装为ChaptGPT的输入,获取输出


上述思路虽然直观,但要获取更好的结果,其实除了第三步,其余每一步都有优化的空间:



  • 文本解析可以针对不同类型的数据针对性解析

  • 文本分句方式可以采取特殊标点进行分句,同时句子embedding也有很多可选生成方法

  • 召回的句子与用户输入句子组装为ChaptGPT的输入,结合任务特定的prompt,获取更适合任务的输出


具体流程图可以参考gpt-langchain-pdf:


gpt-langchain-pdf


gpt-langchain-pdf


作者:centurysee
链接:https://juejin.cn/post/7220775341727399991
来源:稀土掘金
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
收起阅读 »

AutoGPT太火了,无需人类插手自主完成任务,GitHub2.7万星

OpenAI 的 Andrej Karpathy 都大力宣传,认为 AutoGPT 是 prompt 工程的下一个前沿。 近日,AI 界貌似出现了一种新的趋势:自主人工智能。 这不是空穴来风,最近一个名为 AutoGPT 的研究开始走进大众视野。特斯拉前 AI...
继续阅读 »

OpenAI 的 Andrej Karpathy 都大力宣传,认为 AutoGPT 是 prompt 工程的下一个前沿。


近日,AI 界貌似出现了一种新的趋势:自主人工智能

这不是空穴来风,最近一个名为 AutoGPT 的研究开始走进大众视野。特斯拉前 AI 总监、刚刚回归 OpenAI 的 Andrej Karpathy 也为其大力宣传,并在推特赞扬:「AutoGPT 是 prompt 工程的下一个前沿。」



不仅如此,还有人声称 ChatGPT 已经过时了,AutoGPT 才是这个领域的新成员。



项目一经上线,短短几天狂揽 27K + 星,这也侧面验证了项目的火爆。



GitHub 地址:github.com/torantulino…

问题来了,AutoGPT 到底是什么?它是一个实验性的开源应用程序,展示了 GPT-4 语言模型的功能。该程序由 GPT-4 驱动,可以自主实现用户设定的任何目标。



具体来说,AutoGPT 相当于给基于 GPT 的模型一个内存和一个身体。有了它,你可以把一项任务交给 AI 智能体,让它自主地提出一个计划,然后执行计划。此外其还具有互联网访问、长期和短期内存管理、用于文本生成的 GPT-4 实例以及使用 GPT-3.5 进行文件存储和生成摘要等功能。AutoGPT 用处很多,可用来分析市场并提出交易策略、提供客户服务、进行营销等其他需要持续更新的任务。

正如网友所说 AutoGPT 正在互联网上掀起一场风暴,它无处不在。很快,已经有网友上手实验了,该用户让 AutoGPT 建立一个网站,不到 3 分钟 AutoGPT 就成功了。 期间 AutoGPT 使用了 React 和 Tailwind CSS,全凭自己,人类没有插手。看来程序员之后真就不再需要编码了。



之后该用户补充说,自己的目标很简单,就是用 React 创建一个网站。提出的要求是:创建一个表单,添加标题「Made with autogpt」,然后将背景更改为蓝色。AutoGPT 成功的构建了网站。该用户还表示,如果给 AutoGPT 的 prompt 更多,表现会更好。

图源:twitter.com/SullyOmarr/…

接下里我们再看一个例子。假装自己经营一家鞋公司,给 AutoGPT 下达的命令是对防水鞋进行市场调查,然后让其给出 top5 公司,并报告竞争对手的优缺点 :



首先,AutoGPT 直接去谷歌搜索,然后找防水鞋综合评估 top 5 的公司。一旦找到相关链接,AutoGPT 就会为自己提出一些问题,例如「每双鞋的优缺点是什么、每款排名前 5 的防水鞋的优缺点是什么、男士排名前 5 的防水鞋」等。

之后,AutoGPT 继续分析其他各类网站,并结合谷歌搜索,更新查询,直到对结果满意为止。期间,AutoGPT 能够判断哪些评论可能偏向于伪造,因此它必须验证评论者。



执行过程中,AutoGPT 甚至衍生出自己的子智能体来执行分析网站的任务,找出解决问题的方法,所有工作完全靠自己。

结果是,AutoGPT 给出了 top 5 防水鞋公司的一份非常详细的报告,报告包含各个公司的优缺点,此外还给出了一个简明扼要的结论。全程只用了 8 分钟,费用为 10 美分。期间也完全没有优化。



这个能够独立自主完成任务的 AutoGPT 是如何运行的呢?我们接着来看。

AutoGPT:30 分钟内构建你自己的 AI 助手

作为风靡互联网的 AI 智能体,AutoGPT 可以在 30 分钟内完成设置。 你就可以拥有自己的 AI,协助完成任务,提升工作效率。

这一强大的 AI 工具能够自主执行各种任务,设置和启动的简便性是一大特征。在开始之前,你需要设置 Git、安装 Python、下载 Docker 桌面、获得一个 OpenAI API 密钥。

克隆存储库

首先从 GitHub 中克隆 AutoGPT 存储库。



使用以下命令导航到新建文件夹 Auto-GPT。



配置环境

在 Auto-GPT 文件夹中,找到.env.template 文件并插入 OpenAI API 密钥。接着复制该文件并重命名为.env。



安装 Python 包

运行以下命令,安装需要的 Python 包。



运行 Docker

运行 Docker 桌面,不需要下载任何容器,只需保证程序处于激活状态。



运行 AutoGPT



执行以下命令,运行 AutoGPT。



设置目标**

AutoGPT 虽是一个强大的工具,但并不完美。为避免出现问题,最好从简单的目标开始,对输出进行测试,并根据自身需要调整目标,如上文中的 ResearchGPT。

不过,你如果想要释放 AutoGPT 的全部潜力,需要 GPT-4 API 访问权限。GPT-3.5 可能无法为智能体或响应提供所需的深度。

AgentGPT:浏览器中直接部署自主 AI 智能体

近日,又有开发者对 AutoGPT 展开了新的探索尝试,创建了一个
可以在浏览器中组装、配置和部署自主 AI 智能体的项目 ——AgentGPT。** 项目主要贡献者之一为亚马逊软件工程师 Asim Shrestha,已在 GitHub 上获得了 2.2k 的 Stars。



AgentGPT 允许你为自定义 AI 命名,让它执行任何想要达成的目标。自定义 AI 会思考要完成的任务、执行任务并从结果中学习,试图达成目标。如下为 demo 示例:HustleGPT,设置目标为创立一个只有 100 美元资金的初创公司。



再比如 PaperclipGPT,设置目标为制造尽可能多的回形针。



不过,用户在使用该工具时,同样需要输入自己的 OpenAI API 密钥。AgentGPT 目前处于 beta 阶段,并正致力于长期记忆、网页浏览、网站与用户之间的交互。

GPT 的想象力空间还有多大,我们继续拭目以待。

参考链接: medium.com/@tsaveratto…


作者:机器之心
来源:juejin.cn/post/7221089899281580091
收起阅读 »

上海00后小伙AI「复活」奶奶,100%还原音容笑貌,引发巨大争议

**【新智元导读】**最近,00 后小伙用 AI 技术和奶奶实现「对话」,数字生命要成为现实了吗? 你有没有特别想念的人?可能 ta 是你的亲人,也可能是你的伴侣。 无论 ta 是谁,在我们的回忆中永远有他们的一席之地,他们一辈子都会在我们心底最柔软的角落驻留...
继续阅读 »

**【新智元导读】**最近,00 后小伙用 AI 技术和奶奶实现「对话」,数字生命要成为现实了吗?


你有没有特别想念的人?可能 ta 是你的亲人,也可能是你的伴侣。


无论 ta 是谁,在我们的回忆中永远有他们的一席之地,他们一辈子都会在我们心底最柔软的角落驻留。


在哈利波特与死亡圣器中,哈利手握魔法石,他已故的爸爸、妈妈、教父和老师化作幽灵围绕在他的身边。



哈利和他们聊天,攀谈,诉说衷肠,好像他们活过来了一样,紧紧地围绕着他。


而如今,随着 AI 技术和数字虚拟人技术的不断发展,让已故的亲人变成虚拟的数字人继续和我们交谈不再是停留在科幻小说中的情节。


最近,B 站 UP 主吴伍六就用 Midjounrney、ChatGPT 和 D-ID 等最新的 AI 技术「复活」了他刚刚去世的奶奶。


网友看后纷纷表示,恐怖谷。



用 AI「复活」奶奶


在最新的一期视频中,吴伍六为我们还原了「复活」奶奶的整个过程。


首先是头像。要想生成逼真的对话,那么一个栩栩如生的 AI 头像是必不可少的。


吴伍六选择了当下主流的 AI 绘画软件 Midjourney,并上传了一张自己的照片。



最终,他选择了下面这张作为头像,并继续优化。



奶奶的头像也是一样,AI 根据上传的图片与文字描述生成了一些选择,而 UP 主再根据脑海中的回忆挑选一张最逼真的。



之后再如法炮制,用文字细化某些面部特征。比如皱纹、眼眸、发型和神态。我们可以看到,生成的头像细节非常完美。



下一步是音频。这一步的素材基本来自于过去的电话录音、录像视频或者微信语音。而 UP 主将过去奶奶的电话音频上传给了 AI。



并用音频编辑软件 AU 进行调整。调整的方向主要集中在降噪、人声增强等等。


然后将更加清晰的音频样本切割成若干秒的短句,方便进行标注。


最后将处理好的音频打包放入语音合成系统中去。



利用语音合成系统,UP 主就可以尝试输入文本转语音了。


现在,基本的素材都齐全了。接下来就是最关键的一步——生成虚拟数字人。


通过 D-ID,用户可以生成数字虚拟人,并和他们展开交流。



在左侧选择头像,右侧上传文本或音频即可。



网站上奶奶的形象栩栩如生,音频也完美还原了奶奶的「乡音」。搭配上右侧拉家常一般的聊天内容,宛如和奶奶面对面视频通话一样。



有意思的是,奶奶的这些「回复」是 UP 主借助时下大热的 ChatGPT 生成的。


他告诉 ChatGPT,「我很想我的奶奶,你能不能模仿她的口吻来和我交谈?」


透着人情味的人工智能,很难不让人感动落泪。而借助对奶奶的回忆,UP 主也竭尽全力地让 ChatGPT 更像她的奶奶。



科技的最终目标是给人提供力量。这种力量不仅是物质上的,更重要的还是精神上的。虽然这些聊天内容并不完全拟人,也会有一些不贴切的表达。


但总的来说,生活中的小细节还是能给人最温柔的体验的。



数字生命,可行吗?


吴伍六的这段视频引爆了 B 站,网友们众说纷纭。


有关于把逝去的亲人变成虚拟数字人的做法还是个新鲜事物。观念上的转变并不那么容易。


UP 主亲自评论表示,这么做的目的是为了填补自己的小遗憾。在自述中他也提到,奶奶在大年初六去世,最后的几天里奶奶意识模糊,而 UP 主也没有好好的和奶奶告别。


他表示,不会过度缅怀,希望大家能通过 AI 的发展看到未来世界的多样性。



网友「水澹澹而生烟」也表示,这段视频激起了对自己爷爷的回忆。他在 AI 应用和伦理方面并没有过多想法,也不认可把数字虚拟人当作亲人生命的延续。


但他表示,如果能再看爷爷一眼,听一听爷爷的声音,自己就会倍感慰藉。



也有网友表示了不赞同的态度。铁缸哟就认为,数字虚拟人终归还是当不了缅怀之人的精神寄托的。



不过该项技术的未来发展如何,谁也不能预料。就像流浪地球 2 里提到的数字生命的概念一样,想象和现实之间总会存在鸿沟。


没有走到那一步,或者走到那一步之前,一切都是未知的。



当然,小编比较认可网友键垩家の执事的评论。无论虚拟数字人发展到什么地步,多珍藏一些自己所爱之人的照片、音频以及影像这件事,永远不会错。


让记忆停留在心里,让回忆变得更清晰。


参考资料:http://www.bilibili.com/video/BV1QM…


作者:新智元
链接:https://juejin.cn/post/7220351836330262583
来源:稀土掘金
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
收起阅读 »

阿里正式加入ChatGPT战局,“通义千问”突然上线邀测!

阿里版ChatGPT实录 通义千问作为一个大语言模型,它的能力主要集中在文本生成上,即也能像ChatGPT一样“问啥答啥”,除此之外,它还具备一个“百宝袋”功能,功能也非常酷炫,大家普遍感兴趣的就是菜谱生成、彩虹屁生成器和免费代写情书。里面相当于一个工具箱,能...
继续阅读 »

阿里版ChatGPT实录


通义千问作为一个大语言模型,它的能力主要集中在文本生成上,即也能像ChatGPT一样“问啥答啥”,除此之外,它还具备一个“百宝袋”功能,功能也非常酷炫,大家普遍感兴趣的就是菜谱生成、彩虹屁生成器和免费代写情书。里面相当于一个工具箱,能快速生成各种指定类型的文案。


image.png


通义千问能完成哪些任务,解放哪些生产力,能达到 ChatGPT 几分功力?


从实际表现来看,通义千问与领先的GPT 4.0还有很大的差距,但是对比此前的一些AI大模型,通义千问在问答逻辑、信息检索、语句理解等方面都已经有了明显的进步,我现在对中国AI大模型的未来充满了信心。


image.png


通义千问从何而来?


通义千问的诞生并非偶然,是多年技术积累的结果。


2019年,阿里便开始了大模型的研发,当时阿里发布的语言大模型StructBERT超越谷歌、微软、Facebook,登顶了CLUE榜单。


2021年,阿里达摩院发布了国内首个超百亿参数多模态大模型M6,号称神经元达人类的10倍。


在2022年的世界人工智能大会上,阿里还发布了「通义」大模型系列,并宣布相关核心模型向全球开发者开源开放。


image.png


关于通义千问的技术细节,阿里达摩院官方没有透露详细信息。尽管官方口径低调,但懂的都懂,国内科技圈直接炸裂。实力玩家入场,大模型的竞争真正开始了。


正如ChatGPT脱胎于OpenAI的GPT系列,百度文心一言是自Ernie大模型发展而来,阿里也是国内最早开始研发大模型的技术大厂之一。


其中,M6在多次迭代之后,实现了十万亿级别的参数规模,并且M6和支付宝、淘宝的业务需求相结合,首个在国内实现了商业化落地。在去年的WAIC(世界人工智能大会)上,阿里还发布了通义大模型系列。其中核心模型均已开源开放。


image.png


人人都是低代码开发者


生成式AI产品潜力无穷,但能做出类似应用且可将其商业化的公司却凤毛麟角。不少企业认为AI能够助力企业建设,但企业内部多年积累下来的问题非常复杂,比如企业的一个人工智能平台所需要的数据需要从数十个系统获得,而这些系统的对接工作需要花费大量时间和精力,分属同一领域的不同企业的基础设施并不完全相同,简单复制粘贴是无法达到效果的。


在低代码的发展中,流行着一句话:人人都是低代码开发者。


在云计算与软件业,低代码开发,甚至无代码开发是近两年流行的热门概念。核心逻辑是利用代码库,将已有开发样例进行快速复写,整个开发过程中的人工成本趋近于0。


image.png


一套完善的底座意味着在大部分领域通用的解决方案能力。


JNPF,依托代码开发技术原理因此区别于传统开发交付周期长、二次开发难、技术门槛高的痛点。大部分的应用搭建都是通过拖拽控件实现,简单易上手,通过为开发者提供可视化的应用开发环境,降低或去除应用开发对原生代码编写的需求量,进而实现便捷构建应用程序的一种开发平台,快速助力研发人员快速搭建出一套适合企业发展的方案。


开源链接:http://www.yinmaisoft.com/?from=jueji…


image.png


大模型时代,中国力量加速竞逐


相比于现在的业界标杆ChatGPT,通义千问的进步空间还很大,阿里方面也透露,根据内测反馈,这一大模型正在飞速迭代中。


同时,阿里是全球少数在算法和算力上都有领先布局的公司之一,在算力方面也具备天然的优势。ChatGPT这把火烧到如今,国内对具备足够竞争力的国产生成式大模型的需求,正在与日俱增。


image.png


世界正在改变,一个全新的AI时代正在到来,种种不确定因素,再一次凸显了技术自研的价值。所幸这次,我们的起跑线,并没有相差那么远。


游戏不会在一夜间结束,而现在,竞逐真正开始。最后,大家有什么问题想问通义千问?请在大胆留言。


作者:jnpfsoft
链接:https://juejin.cn/post/7220331340762677303
来源:稀土掘金
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
收起阅读 »

我把我的简历丢给chatGPT,他问了我这些问题

前言 chatGPT是openAI于2022年11月推出的人工智能聊天程序,chatGTP一经推出便火爆全网,通过一问一答且结合上下文的方式自动生成问题答案,作为前端开发工程师,我们可以使用chatGTP进行代码纠错,代码优化等一系列的代码调试,当然,作为一个...
继续阅读 »

前言


chatGPT是openAI于2022年11月推出的人工智能聊天程序,chatGTP一经推出便火爆全网,通过一问一答且结合上下文的方式自动生成问题答案,作为前端开发工程师,我们可以使用chatGTP进行代码纠错,代码优化等一系列的代码调试,当然,作为一个已经失业一个月的前端开发,我们还可以让chatGTP作为面试官,来对我们进行一次模拟面试。


向chatGPT提问


提问内容需要对它进行一个身份设定,它是一名前端开发的面试官。


image.png


然后将自己的简历复制一份,最好先整理一下格式,然后抛给它。


chatGPT返回的问题


根据我的简历他问了我以下几个问题:


面试官:尊敬的面试者,您的简历显示您具备丰富的前端开发经验,我们非常高兴能邀请您来参加面试。现在让我们开始探讨一些与您工作经历和技能相关的问题,期待您的精彩回答。



  1. 请详细阐述您在使用 HTML5、CSS3 和 ES6 新特性中的心得体会,以及如何在实际项目中应用这些新特性提升工作效率与用户体验。

  2. 闭包、原型和作用域等 JavaScript 基础知识在您的项目中发挥了什么作用?请结合实际项目案例,谈谈您如何运用这些知识解决实际问题。

  3. 在您的项目经历中,如何运用 Vue 全家桶以及 MVVM 思想来提升开发效率?请结合具体项目案例谈谈您的实践经验。

  4. 您曾尝试写过一个简单的 MVVM 框架,可以简要介绍下您的实现思路和遇到的挑战吗?

  5. 您在xxx问题的经验和方法值得我们借鉴,请详细介绍这个过程以及您对于类似问题的解决方案。

  6. 您如何运用 three.js 进行 3D 可视化开发?请举例说明您在项目中的具体应用。

  7. 您在项目中遇到过哪些让您印象深刻的技术挑战?您是如何克服这些挑战的?

  8. 请谈谈您对于前端开发中代码规范和项目管理的理解,以及您在实际工作中如何保证高质量的代码输出。

  9. 在您看来,一个优秀的前端开发者应具备哪些品质和技能?请结合您的实际经历分享一下。


期待您对这些问题的精彩回答。祝您面试顺利,前程似锦!


image.png


可以看出chatGTP的模拟面试其实更偏向于对项目方面进行模拟面试,而我要求面试中包含大量八股文,这个是没有给到的,我意识到它可能是无法理解“八股文”在前端开发面试中代表的意思,于是我又换了个说法提问它。


提示chatGPT提问八股文


你是一名前端开发工程师,请根据我的简历对我进行面试,面试主要面试常见的基础知识?


image.png


chatGPT面试官对于八股文的提问


面试官:你好,根据你的简历,我了解到你具备扎实的前端开发基础。在接下来的面试环节中,我将针对一些常见的前端基础知识进行提问。请放轻松,尽量展示你的技能和经验。



  1. 请谈谈你对HTML5和CSS3新特性的理解。你在实际项目中如何运用这些新特性?

  2. 请解释一下JavaScript中的闭包(closure),并给出一个闭包的应用场景。

  3. 请简述原型链(prototype chain)的概念,以及它在JavaScript中的应用。

  4. 在你的项目中,你是如何处理跨域请求的?

  5. 请谈谈你对前端性能优化的理解,以及在项目中采取了哪些措施来提升性能?

  6. 请解释一下Event Loop(事件循环)机制以及它在JavaScript中的作用。

  7. 你在实际项目中如何使用Vue全家桶(Vue-router、Vuex等)?请分享一下你的经验。

  8. 在你的项目中,你是如何处理浏览器兼容性问题的?

  9. 请解释一下HTTP缓存机制,以及如何在项目中利用HTTP缓存提高性能?

  10. 请谈谈你对响应式设计(Responsive Design)的理解以及如何在项目中实现响应式设计。


请根据这些问题,尽量详细地展示你的知识和实际经验。如果对某个问题不太了解,也可以跳过,我们会综合评估你的技能。祝你面试顺利!


或许这些八股文还不够,可以要求它提问更多八股文


你是一名前端开发工程师,请根据我的简历对我进行面试,面试请提供更多面试常见的基础知识问题


image.png


chatGPT再次提问八股文


面试官:你好,根据你的简历,我了解到你具备扎实的前端开发基础。在接下来的面试环节中,我将针对一些更多的前端基础知识进行提问。请放轻松,尽量展示你的技能和经验。



  1. 请解释一下HTML语义化的概念及其优点。

  2. 请描述CSS盒模型(Box Model)的组成部分以及在布局中的作用。

  3. 请简要介绍一下Flex布局和Grid布局,以及它们各自的应用场景。

  4. 在JavaScript中,谈谈你对作用域和作用域链的理解。

  5. 请解释一下JavaScript的同步和异步,以及如何使用Promise、async/await处理异步操作。

  6. 请谈谈你对Vue的生命周期钩子函数的理解以及常见的应用场景。

  7. 请描述一下Vue中的计算属性(computed property)和侦听属性(watch property)以及它们的区别和应用场景。

  8. 在你的项目中,你是如何使用Webpack进行模块化打包和优化的?

  9. 请解释一下浏览器的渲染机制以及如何利用这一知识进行页面性能优化。

  10. 在项目中,你是如何进行前端安全防范,例如防止XSS攻击和CSRF攻击的?

  11. 请谈谈你对前端单元测试的理解,以及在项目中如何进行单元测试。

  12. 请解释一下前端MVC和MVVM设计模式的概念及其区别。

  13. 请谈谈你对前端性能监控和数据埋点的理解以及在项目中的应用。

  14. 请简要介绍一下如何在项目中实现前后端分离以及它带来的好处。

  15. 请谈谈你对Web Accessibility(网络无障碍)的理解以及如何在项目中实现无障碍访问。


请根据这些问题,尽量详细地展示你的知识和实际经验。如果对某个问题不太了解,也可以跳过,我们会综合评估你的技能。祝你面试顺利!


image.png


关于此次模拟面试提问的总结


这样我们此次模拟面试就获得了9条关于项目的问题,和25条关于基础的问题,细看这几个问题都是明显贴合我的简历所问的问题,大部分面试官都是会针对简历进行面试,所以根据自己的简历整理可能提到的问题是非常重要的,而关于项目方面提出的问题,与我进行大厂模拟面试所遇到的问题更为相像。通过chatGPT进行模拟面试,算得上是一场挺有质量的面试了。


尝试回答部分chatGPT模拟面试提出的问题


1. 请谈谈你对HTML5和CSS3新特性的理解。你在实际项目中如何运用这些新特性?


HTML5新出了许多语义化标签(nav,header,main等)和API(canvas,webGL),语义化标签优点在于提高代码可读性和可维护性,有利于搜索引擎更容易读懂(seo),有些特殊的屏幕阅读器可以通过分析语义化标签进行展示(比如盲人阅读器)。CSS3新出了圆角,阴影,过渡,动画,弹性布局等使创造复杂样式和交互变得更简单,也使我们可以更快的去完成页面样式。


2. 请解释一下JavaScript中的闭包(closure),并给出一个闭包的应用场景。


闭包是指函数有权访问其作用域以外的变量,这就叫闭包,闭包有两种表现形式,一种是函数作为参数传递,一种是函数作为返回值,闭包的应用场景有防抖节流函数、setTimeout、封装私有变量。闭包的缺点在于,其访问的变量不会被回收(会一直占用内存),所以会造成内存泄漏。


3. 请简述原型链(prototype chain)的概念,以及它在JavaScript中的应用。


原型链是js的一种继承方式,每个对象都有自己的__proto__属性指向其构造函数的prototype属性,当对象调用某个方法且对象里并没有定义这个方法时就会通过__proto__去寻找这个方法,如果其__proto__没有就会顺着其__proto__的__proto__就是顺着其原型链去寻找方法直到null。


4. 在你的项目中,你是如何处理跨域请求的?


因为浏览器的同源策略(ip,端口,协议需要一致),我们跨域请求的时候会出现跨域问题,
在开发环境中,我使用代理服务器(如vue.config.js中的proxy配置)解决跨域问题。在生产环境中,我是用nginx的代理解决跨域问题。
当然也可以让后端在服务器端设置响应头,允许跨域请求。或者是用websocket,websocket没有跨域问题。


5. 请谈谈你对前端性能优化的理解,以及在项目中采取了哪些措施来提升性能?


前端性能优化分为两类,一种是让文件加载更快,另一种是让文件渲染更快。


加载更快的方法



  • 让传输的数据包更小(压缩文件/图片):图片压缩和文件压缩

  • 减少网络请求的次数:雪碧图/精灵图、节流防抖

  • 减少渲染的次数:缓存(HTTP缓存、本地缓存、Vue的keep-alive缓存等)

  • 使用CDN:利用内容分发网络(Content Delivery Network)加速静态资源的加载速度,将资源部署到离用户更近的服务器


文件渲染更快的方法



  • 提前渲染:ssr服务器端渲染

  • 避免渲染阻塞:CSS放在HTML的head中 JS放在HTML的body底部

  • 避免无用渲染:懒加载

  • 减少渲染次数:对dom查询进行缓存、将dom操作合并、减少重排重绘


6. 请解释一下Event Loop(事件循环)机制以及它在JavaScript中的作用。


Event Loop是js实现异步的一种机制,它让js这个单线程语言可以实现并发操作。JavaScript引擎在执行栈为空时,会从任务队列中取出任务执行;任务队列有两类。



  • 宏任务:包括script(整个代码)、setTimeout、setInterval、setImmediate和I/O等。

  • 微任务:Promise、process.nextTick等


先执行宏任务再执行微任务


7. 你在实际项目中如何使用Vue全家桶(Vue-router、Vuex等)?请分享一下你的经验


我通过vue-router进行路由管理,通过Vuex管理全局状态,我会对路由进行懒加载,通过ES6的import,当然也可以用vue的动态组件,Vuex的核心包括state、getter、mutation和action,通过mutation去更改state的值,要注意异步操作只能放在action里。


8. 在你的项目中,你是如何处理浏览器兼容性问题的?


处理浏览器兼容性问题,我会使用autoprefixer自动添加CSS前缀,使用Babel转译新语法,使用Polyfill补充缺失功能,并针对特定浏览器进行特殊处理。


9. 请解释一下HTTP缓存机制,以及如何在项目中利用HTTP缓存提高性能?


http缓存包括强缓存和协商缓存



  • 强缓存:浏览器自己的缓存策略


强缓存是通过Cache-Control字段来控制的,值有max-age(缓存的最大时间)、no-cache(无需强制缓存)、no-store(服务端直接返回)



  • 协商缓存: 由服务器判断资源是否一样,一致则返回304,否则返回200和最新资源


判断资源是否一致,这主要通过Last-Modified/If-Modified-Since和ETag/If-None-Match头部字段实现。
Last-Modified:资源最后修改时间。
If-Modified-Since:客户端下次请求相同资源时,会发送该字段,值为上次收到的Last-Modified的值。
ETag: 资源的唯一标识
If-None-Match: 客户端下次请求相同资源时,会发送该字段,值为上次收到的ETag值。


10. 请谈谈你对响应式设计(Responsive Design)的理解以及如何在项目中实现响应式设计。


响应式设计就是指让网站在不同设备下实现自适应展示,实现响应式设计有以下几种方法



  • 不使用固定单位使用相对单位,如百分比,rem,vw/vh等

  • 尽可能的使用弹性布局

  • 媒体查询:针对不同的屏幕尺寸,修改对应的css


11. 在JavaScript中,谈谈你对作用域和作用域链的理解。


作用域是指变量和函数的可访问的上下文,就是其作用域,作用域链是由指变量或函数查找时先从当前的执行上下文往其夫级的上下文寻找,直到最外层的window。


12. 请解释一下JavaScript的同步和异步,以及如何使用Promise、async/await处理异步操作。


js是一个单线程语言,所以会同步执行代码,为了防止代码阻塞,通过时间循环机制实现了代码异步处理,当同步代码都执行完毕之后,再去执行异步代码,常见的异步代码有网络请求、alert、setTimeout等,promise是异步的解决方案,它解决了之前通过回调函数实现异步而产生的回调地狱的问题,promise有三种状态,pendding、reject、fulfilled,只能从pedding到其他状态,且过程不可逆,async和await是基于promise实现的,它是为了让异步代码看起来像同步代码,使代码更容易阅读和维护。


13. 请谈谈你对Vue的生命周期钩子函数的理解以及常见的应用场景。


vue的组件的生命周期包括组件创建、组件挂载、组件更新、组件销毁,从中产生了生命周期钩子函数。
vue2中包括 beforeCreate、created、beforeMounte、Mouted、beforeUpadte、updated、beforeDestory、destroyed,如果组件使用了keep-alive进行缓存的话,还会有active、deactive。


vue3中的生命周期包括setup,onBeforeMount、onMounted、onBeforeUpdate,onUpdatedon、onBeforeUnmount、onUnmounted。


mouted(onMounted)钩子函数可以做一些关于dom的操作,beforeDestroy(BeforeUnmount)在此阶段可以执行清理工作,如移除事件监听器、取消计时器等。


14. 请描述一下Vue中的计算属性(computed property)和侦听属性(watch property)以及它们的区别和应用场景。


计算属性是依赖其他属性变化得出结果,而侦听属性是针对数据变化而触发操作,计算属性具有缓存机制。


15. 请谈谈您对于前端开发中代码规范和项目管理的理解,以及您在实际工作中如何保证高质量的代码输出。


前端代码规范和项目管理在前端开发中非常重要,他可以保证代码风格一致,提高代码可读性,提高项目可维护性和团队协作效率。


在实际工作中我使用如下内容保证高质量的代码输出。



  • 统一的编码风格:用代码风格指南和自动化工具(如ESLint、Prettier等)

  • 使用版本控制系统: 通过git来管理代码

  • 注释和文档: 编写清晰明了的readme.md

  • Code Review: 团队成员对代码进行代码审查


总结


本次面试,各位面试官满意吗?如有什么错误欢迎大佬们评论区反馈纠正。


作者:三三两两的小久
来源:juejin.cn/post/7220274775914037285
收起阅读 »

为什么ChatGPT不是中国搞出来的?

无论是2022年11月30日上线的ChatGPT,还是最近 OpenAI 正式发布的迄今为止规模最大、功能最强悍的多模态预训练模型 GPT-4,都着实让普罗大众感受到了AI人工智能的强大威力,宣告了强人工智能时代的到来。在这场人工智能引发的破圈热闹之下,我们不...
继续阅读 »

无论是2022年11月30日上线的ChatGPT,还是最近 OpenAI 正式发布的迄今为止规模最大、功能最强悍的多模态预训练模型 GPT-4,都着实让普罗大众感受到了AI人工智能的强大威力,宣告了强人工智能时代的到来。在这场人工智能引发的破圈热闹之下,我们不免要进一步深入思考一个问题,为什么这么多年过去了,引领产业技术革命的依然是美国而不是中国?


2021年,中国以全球AI顶级会发表的论文数27.6%的比例高居榜首,而欧盟和英国以19.0%紧随其后,美国以16.9%位居第3。无论AI人工智能论文发表量还是专利申请量,中国在全世界范围内都名列前茅,那么按道理来说中国在AI人工智能领域的研究既广泛又深入,像ChatGPT这样具有里程碑意义的人工智能应用应该在中国诞生才对。虽然说自然语言理解和生成是人工智能研究领域的一座高峰,想要攀登和征服就需要持续不断地高质量资源投入,而阿里达摩院、华为以及清华大学等研究机构也在做类似的事情。不过很遗憾,最终还是美国的OpenAI率先发布了强大的ChatGPT。今天我们试图客观的分析下是什么原因造成了我们没有成为新一代技术革命的发起人,以后我们应该怎么做才能成为未来技术的引领者而不是跟随者。



原因分析


也许是因为过去中国二十年互联网的蓬勃发展,国内一些互联网巨头公司的市值可以在国际上和美国的互联网公司掰手腕了,让我们产生了不少的错觉,误以为在技术上我们也可以和美国一较高下了,但是事实真的如此吗?


相信大家在新闻中经常可以看到,这几年为了遏制中国发展,美国政府不断向中国高科技行业挥舞制裁大棒。比如向中国华为公司实施技术封锁,以国家安全为由,禁止美国公司向华为出售技术和设备。一时间中国的高端芯片行业哀鸿遍野,遭遇技术卡脖子危机。我们在感叹美国政府无耻的同时,也为自身没有预先布局底层技术研究以及体系构建而感到扼腕叹息。这次OpenAI发布的ChatGPT以及GPT4又给我们上了一课,越来越多的人认识到中国和美国的技术差距何止高端芯片,前沿的人工智能技术、强大的算力网络等等诸多高新技术方面都和美国有不小的差距。美国政府打压中国高科技行业发展这一巴掌,终于把一些还对美国抱有幻想的技术人彻底打醒,无论高端芯片还是前沿人工智能等核心技术买不来也求不来,只能靠自己一步一个脚印地走出来。当然这也坚定了我们和美国有关的技术类别必须全部实现国产化替代的决心。


过度关注商业模式,忽视底层技术研究


在过去的20年当中,中国互联网行业处在高速发展阶段,据CNNIC(中国互联网络信息中心)报告,截至2022年12月,我国网民规模达10.67亿。随着互联网在线人数的持续攀升,各种各样形态的商业模式在这片热土上不断得以验证以及发展壮大。移动支付、电商物流、外卖打车、短视频等商业形态深刻改变了老百姓的日常生活方式,为大家带来了极大的生活便利以及娱乐消遣,同时也提升了整个社会的效率。但与此同时,各大互联网公司好像都沉浸在如何发展新商业模式以及维护已有商业格局的怪圈中不可自拔,几乎所有的精力都放在业务内卷上。因此投入底层技术研究的时间和资源相对就会被挤压甚至是完全没有,最终导致被别人技术卡脖子的概率大大提升,同时能够产生颠覆性创新技术的可能性却大大降低。


对比中美两国技术发展路线,我们可以发现一个有意思的现象。在中国,技术的发展大都是围绕业务进行,也就是说当一个业务模式被推出来之后,如果想要支撑这样的业务规模就需要发展什么样的技术,那就研究和发展什么技术,通过商业模式的创新、业务的发展推动技术向前发展演进。



但是美国好像正好相反,常常是一项技术的发展进步反向催生出新的商业形态。就拿推出ChatGPT的OpenAI公司来说,它原本就是一个非营利性的技术组织,集结了AI人工智能界的各路大佬,初衷就是让人工智能向着友好的方向发展,核心宗旨在于“实现安全的通用人工智能(AGI)”,使其有益于人类。GPT模型经过不断的迭代升级最终搞出来了ChatGPT,有望成为未来人工智能应用技术的基础底座,因此未来可能将会有海量的上层应用都是基于ChatGPT来进行构建,可以毫不夸张地说,ChatGPT或者说通用大模型也许就是人工智能领域的操作系统,将来会诞生多少新的的商业模式以及业务形态不可估量,这种技术革命是自下而上的颠覆性创新将会对未来的产业形态产生深远的影响。



而我们太关注上层应用商业模式的创新了,从而忽略了底层技术的研究。我们仿佛在一次又一次的电商大促、一次又一次的短视频娱乐中逐渐迷失了方向,表面上的热闹掩盖不了底层核心技术的匮乏。其实想想就背后发凉,当下无论是互联网技术、人工智能技术等前沿技术好像都是建立在别人的技术底座之上的。那些曾经我们引以为豪的移动支付、电商物流等等不过是这些底层技术的上层应用而已。如果被人家釜底抽薪,那真的就玩不转了。所以底层技术真的非常重要,可以说没有底层技术的支撑,所有上层的应用都是空中楼阁。


缺乏长期主义


也许是国内竞争压力太大了,无论是个人还是公司,都恨不得今天投进去资金,明天就能看到结果和收益。如果在短期看不到收益的项目,一般公司实际上很难有持续的资源投入,更别提看不到明确回报周期的基础技术研究了。浮躁的氛围,层出不穷的技术噱头,表面上的热热闹闹,只会让大家都热衷于赶时髦追风口,却没有多少人能真正静下心来进行长期的技术研究。又有多少公司可以有马老师那样的魄力和实力每年10个亿连投10年,最终投出来个阿里云。


说到这里,不知道大家还记不记得区块链、VR、元宇宙这些科技名词,一开始出现的时候受到了极大的关注和资本的热烈追捧。但是当热头过去之后,现在又有多少公司还在不断地进行产品迭代,不断地进行技术深度优化研究呢?不能说完全没有但绝对是寥寥无几,与其说是他们追捧高新技术,不如说他们追捧的是如何快速赚钱的工具。至于到底是VR、元宇宙还是ChatGPT其实都无所谓,对他们来说其实就是个技术名称而已。


但是实际上无论是ChatGPT还是GPT4这样的人工智能应用,都不是横空出世的,它们都是在GPT、GPT2以及GPT3基础上逐步迭代发展而来的,这其中耗费了多少顶尖人工智能专家长期坚持的心血以及大量资金的持续投入。OpenAI在获得微软投资之前的三四年里烧掉将近1亿美元,才搞出来一个以GPT第一代模型为基础的雏形,当时还远远达不到ChatGPT今天的效果。基础技术研究不是一朝一夕就能完成的事情,它需要不断的试错,需要对未来技术发展趋势的独到眼光,更加需要长期主义的坚持。不过让我们感到欣慰的是,阿里巴巴、华为在技术研究上的投入已经每年超过1000亿,相信在不远的将来一定会有新的技术突破出现。


缺乏技术体系支撑


就好比高端芯片制造,其中涉及芯片设计、芯片制造以及封装测试都是一整套复杂的工艺缺一不可。同样通用大模型也是一个复杂的系统工程,而通用大模型的训练离不开海量的高质量训练数据、优秀的深度学习算法以及强大的算力资源支撑。ChatGPT的成功得益于高质量的标注数据,OpenAI为了获得高质量的训练数据雇佣了超过40家承包商进行数据标注,这在国内几乎是不敢想象的事情。另外以ChatGPT在2023年1月的独立访客平均数1300万计算,其对应芯片需求为3万多片英伟达A100 GPU,如果没有庞大的算力支撑,很难训练出高质量的通用大模型。


也就是说,通用大模型的训练需要一个完整的人工智能技术体系来进行支撑,否则即便有先进的算法,但如何获得高质量的训练数据,到哪里去找庞大的训练算力资源,这些都是摆在通用大模型训练面前必须要解决的问题,否则没有高质量的数据以及算力支撑也是巧妇难为无米之炊。


如何破局


通用大模型是未来人工智能的重要发展方向,我们肯定要加大资源投入力度才能有机会在未来人工智能前沿技术的竞争中占有一席之地。那我们应该怎么做才能破局呢?我想可以从以下几个方面入手。


数据方面


虽然当前中文在线联网数据也算是海量,但是数据质量普遍不高,同时数据孤岛问题比较严重。如果我们想基于中文数据来训练通用大模型,就必须对中文在线数据进行治理提高中文在线数据质量,解决数据孤岛问题,推动实现数据的共享和互联互通。


算力建设方面


结合国家东数西算工程,协调各个区域的算力中心,形成全国通用算力基础设施,加快构建国家级一体化新型算力网络体系,为通用大模型训练提供源源不断的强大算力支撑。只有这样,才能满足大模型训练所需要的算力要求,同时为强人工智能时代的到来做好算力资源储备。



意识方面


和别人的技术差距,我们当然要尽力弥补。不过我们需要注意的是我们在进步,别人也在进步,所以我们光追赶别人不行,还要有更加长远的眼光,要有对于未来准确的判断力,进行提前技术验证以及产业布局,为下一次技术革命做准备,真正成为未来技术发展的引领者而不是追随者。


总结


科技的发展进步不是一朝一夕就能实现的,它可能需要一代又一代技术人员孜孜不倦地追求。虽然我们在很多领域都已经取得了长足的进步,但是同时我们也要清醒地认识到,在计算机领域、互联网技术领域以及人工智能技术领域我们还有不小的差距需要弥补。因此少一点网红、明星的曝光,多一点科技工作者勤恳务实地宣传,努力营造技术为先、科技为先的社会氛围才是未来科技行业蓬勃发展的社会环境基础。我相信如果我们可以少一点浮躁,多一点纯粹,也许下一次的科技革命就是在中国这片土地上诞生。最后和大家分享下马老师曾经说过的一段话,我觉得对我们当下思考未来技术发展非常有帮助。



我一直觉得填补空白这句话是有问题的,不是因为欧美的就是先进的,就是我们要去填补的。其实今天我们不应该要和哪个东西接轨,适应哪国的标准,填补哪个空白,今天我们要思考的是怎么和未来接轨,怎么适应未来的标准,怎么弥补未来的空白,我们要想明白未来是如何的,以及自己到底要做成一个什么样的体系,然后再去看看别人怎么做,如果永远重复别人的语言,讨论别人设定的主题,我们不但会迷失现在,而且会错失未来。


作者:慕枫技术笔记
链接:https://juejin.cn/post/7218048201981935677
来源:稀土掘金
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
收起阅读 »

一个令人惊艳的ChatGPT项目,开源了!

最近在GitHub上发现了一个爆火的开源项目。 好家伙,凑近一看,居然还是由微软开源,并且和最近炙手可热的ChatGPT息息相关。 项目的名字叫做:Visual ChatGPT。 github.com/microsoft/v… 这个项目最早是3月上旬微软...
继续阅读 »

最近在GitHub上发现了一个爆火的开源项目。


好家伙,凑近一看,居然还是由微软开源,并且和最近炙手可热的ChatGPT息息相关


项目的名字叫做:Visual ChatGPT



github.com/microsoft/v…




这个项目最早是3月上旬微软开源的,项目宣布开源后仅用了短短一周,就斩获了2w+ star。



到现在为止,距离当初项目开源大约过去了3周多,仓库star数则来到了28k+,亦可谓是火箭式上涨(doge)。


众所周知,ChatGPT自2022年11月推出以来,持续走红。



ChatGPT具备强大的会话能力,可以理解文字、聊天、写小说、解答问题、编写代码... 但是目前还并不能直接处理或生成图像。


而Visual ChatGPT这个项目则可以把ChatGPT和一系列视觉基础模型(VFM,Visual Foundation Model)给联系起来,以便实现在ChatGPT聊天的过程中来发送和接收图像,也使得ChatGPT能够处理更为复杂的视觉任务。



讲白了,就是通过Visual ChatGPT,可以把一系列视觉基础模型给接入ChatGPT,使得ChatGPT能胜任更为复杂的视觉处理任务。



Visual ChatGPT的整体技术架构图如上所示,我们可以清楚地看到ChatGPT和视觉基础模型(VFM,Visual Foundation Model)分别位于其中的位置。


一方面,ChatGPT(或LLM)作为一个通用接口,继续发挥它本身的优势,提供对不同话题的智能理解。另一方面,基础视觉模型VFM则通过提供特定领域的深入知识来充当领域专家,它们通过交互管理模块(Prompt Manger)进行连接和适配。


这样聊可能比较抽象,我们可以拿官方给的一个例子来进行说明:



1、首先是用户:输入一张黄色的向日葵图片,并且要求ChatGPT根据该图像预测深度来生成一朵红花,然后再一步一步将其做成卡通画。


2、接着是交互管理模块(Prompt Manger)发挥作用,在它的协调和控制下,VFM模块开始发挥作用:



  • 首先需要运用深度估计模型来预测并生成图像的深度信息;

  • 然后需要运用深度图像模型来生成对应空间深度的红花图像;

  • 最后运用Stable Diffusion的风格迁移模型来完成图像风格的变换。


3、最后Visual ChatGPT系统再将最终结果返回给用户,完成本次对话。


说到这里,有兴趣的小伙伴可以可以看看微软给出的一篇有关Visual ChatGPT的论文。



里面关于这部分的流程解释得非常详细,而且还给出了多轮对话的案例、以及实验结果,有兴趣的小伙伴可以看看。


好了,今天的分享就到这里了,感谢大家的收看,我们下篇见。


作者:CodeSheep
链接:https://juejin.cn/post/7217851001087230013
来源:稀土掘金
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
收起阅读 »

阿里版ChatGPT:通义千问pk文心一言

随着 ChatGPT 热潮卷起来,百度发布了文心一言、Google 发布了 Bard,「阿里云」官方终于也宣布了,旗下的 AI 大模型“通义千问”正式开启测试! 申请地址:tongyi.aliyun.com/ 阿里云的 Ai 模型名为“通义千问”,由达摩院开...
继续阅读 »

随着 ChatGPT 热潮卷起来,百度发布了文心一言、Google 发布了 Bard,「阿里云」官方终于也宣布了,旗下的 AI 大模型“通义千问”正式开启测试!



申请地址:tongyi.aliyun.com/


阿里云的 Ai 模型名为“通义千问”,由达摩院开发,也是一款 NLP 大语言模型,主要能力也是专注在文本生成,可以做到跟 ChatGPT 类似的“你问我答”。


获得测试申请邀请码方法:



  • 注册一个阿里云帐号 (注册按钮在页面右上角)

  • 前往「通义千问」官网 tongyi.aliyun.com/

  • 填写「企业邮箱」进行报名预约,等待审核


官网宣称只邀请企业进行测试,但只要用户在报名时「使用企业邮箱」,并随便填写一个公司的名称信息即可。


 


通义千问pk文心一言


拿到测试邀请码以后,我第一时间试用了一下,并且和百度的文心一言做了对比。


为什么不直接对比ChatGPT,因为我的ChatGPT账号已经被封了哈哈。



 


 


提问:通义千问和文心一言谁更厉害?



 


 


 



 


 


 


 


提问:李明是李丽的哥哥,刘云是李丽的妈妈,李明是刘云的谁?



 


 


 



 


 


 


 


提问:通义千问没有AI绘画功能:


 



 


 



 


 


根据官网描述,通义千问是一个能专门响应人类指令的大模型,可以是一名效率助手,也可以是点子生成器。


可以非常方便地帮我们写作、写文案、翻译、解答问题等工作,支持上下文关联理解。其中官方表示比较出色的地方在于撰写文案,经测试,当说要它写一篇语文老师要求的“总分总”结构的文章它也能听得懂。


国产版ChagtGPT通义千问和文心一言,最后谁能胜出,你怎么看?


作者:邴越
链接:https://juejin.cn/post/7219925045228453946
来源:稀土掘金
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
收起阅读 »

调教ChatGPT提取公众号封面

牙叔教程 简单易懂 我抱着调教的心, 被ChatGPT调教了, 😭, 看看我是怎么被ChatGPT调教的 提取公众号prompt prompt就是提示语, ChatGPT会根据提示语做事情,  提取封面的提示语是: 用Node.js提取微信公众号封面的url...
继续阅读 »

牙叔教程 简单易懂


我抱着调教的心, 被ChatGPT调教了, 😭,


看看我是怎么被ChatGPT调教的




提取公众号prompt


prompt就是提示语, ChatGPT会根据提示语做事情, 


提取封面的提示语是: 用Node.js提取微信公众号封面的url


效果


每次登录ChatGPT太麻烦了, 还怕浏览器随时获取IP, 被openai审查, 所以自己写了个网页调用api,


想要网页的老铁, 公众号回复 api网页


用api网页可以降低封号概率, 我这个号可一次都没被封过



截图看不清楚, 我贴上文字;


只有第一行是我的, 其他的都是ChatGPT回复的内容


用Node.js提取微信公众号封面的url
要提取微信公众号封面的URL,可以使用Node.js和request模块来发送HTTP请求并解析返回的HTML页面。以下是一个示例代码:

```javascript
const request = require('request');
const cheerio = require('cheerio');

const url = 'https://mp.weixin.qq.com/s/xxxxxxxxxxxxxx'; // 公众号文章链接

request(url, function (error, response, body) {
if (!error && response.statusCode == 200) {
const $ = cheerio.load(body);
const coverUrl = $('meta[property="og:image"]').attr('content');
console.log(coverUrl);
}
});
```

在这个示例中,我们首先使用request模块发送HTTP请求,并在回调函数中处理响应。然后,我们使用cheerio模块解析返回的HTML页面,并使用jQuery样式的语法来获取页面中的元素。在这个例子中,我们使用`$('meta[property="og:image"]')`来获取页面中的`<meta>`标签,然后使用`.attr('content')`来获取`content`属性的值,即公众号封面的URL。最后,我们将URL打印到控制台中。

需要注意的是,这个示例只能提取公众号文章页面中的封面URL,而不能直接提取公众号的封面URL。如果要提取公众号的封面URL,可以参考以下代码:

```javascript
const request = require('request');
const cheerio = require('cheerio');

const url = 'https://mp.weixin.qq.com/profile?src=3&timestamp=1631955330&ver=2&signature=xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx'; // 公众号主页链接

request(url, function (error, response, body) {
if (!error && response.statusCode == 200) {
const $ = cheerio.load(body);
const coverUrl = $('.profile_header .avatar img').attr('src');
console.log(coverUrl);
}
});
```

在这个示例中,我们首先发送HTTP请求,然后使用cheerio模块解析返回的HTML页面。我们使用`.profile_header .avatar img`来获取公众号主页中的头像图片元素,然后使用`.attr('src')`来获取`src`属性的值,即公众号的封面URL。最后,我们将URL打印到控制台中。

先试试第一段代码


const request = require('request');
const cheerio = require('cheerio');

const url = 'https://mp.weixin.qq.com/s/tcorJxJBWoF0yOUHOypuQw'

request(url, function (error, response, body) {
if (!error && response.statusCode == 200) {
const $ = cheerio.load(body);
const coverUrl = $('meta[property="og:image"]').attr('content');
console.log(coverUrl);
}
});

运行以后获取到的封面图片链接


$ node 1
https://mmbiz.qpic.cn/mmbiz_jpg/n3RS3ib3lbz9krBGCZ6jkE6xROetdnyvlPEl6wmoh27gIwaKTe7EuaV7lKgsQ69uXXnVpXnXzNSKc0oG8CdSf7g/0?wx_fmt=jpeg

node 1 的意思


代码是nodejs执行的, 1是文件名1.js


链接正确吗


正确到姥姥家了, 我滴个妈呀, 我就只说了一句话, ChatGPT把事情给我办的, 妥妥当当的


提取到的封面图



还想调教ChatGPT


调教个锤子哦, 一发就中, 饭碗不保了, 兄弟们


用不了GPT怎么办?


可以用 谷歌的Bard


也可以用 微软的NewBing


微信公众号 牙叔教程


作者:牙叔教程
来源:juejin.cn/post/7219599208608284730
收起阅读 »

为什么ChatGPT不是中国搞出来的?

无论是2022年11月30日上线的ChatGPT,还是最近 OpenAI 正式发布的迄今为止规模最大、功能最强悍的多模态预训练模型 GPT-4,都着实让普罗大众感受到了AI人工智能的强大威力,宣告了强人工智能时代的到来。在这场人工智能引发的破圈热闹之下,我们不...
继续阅读 »

无论是2022年11月30日上线的ChatGPT,还是最近 OpenAI 正式发布的迄今为止规模最大、功能最强悍的多模态预训练模型 GPT-4,都着实让普罗大众感受到了AI人工智能的强大威力,宣告了强人工智能时代的到来。在这场人工智能引发的破圈热闹之下,我们不免要进一步深入思考一个问题,为什么这么多年过去了,引领产业技术革命的依然是美国而不是中国?


2021年,中国以全球AI顶级会发表的论文数27.6%的比例高居榜首,而欧盟和英国以19.0%紧随其后,美国以16.9%位居第3。无论AI人工智能论文发表量还是专利申请量,中国在全世界范围内都名列前茅,那么按道理来说中国在AI人工智能领域的研究既广泛又深入,像ChatGPT这样具有里程碑意义的人工智能应用应该在中国诞生才对。虽然说自然语言理解和生成是人工智能研究领域的一座高峰,想要攀登和征服就需要持续不断地高质量资源投入,而阿里达摩院、华为以及清华大学等研究机构也在做类似的事情。不过很遗憾,最终还是美国的OpenAI率先发布了强大的ChatGPT。今天我们试图客观的分析下是什么原因造成了我们没有成为新一代技术革命的发起人,以后我们应该怎么做才能成为未来技术的引领者而不是跟随者。



原因分析


也许是因为过去中国二十年互联网的蓬勃发展,国内一些互联网巨头公司的市值可以在国际上和美国的互联网公司掰手腕了,让我们产生了不少的错觉,误以为在技术上我们也可以和美国一较高下了,但是事实真的如此吗?


相信大家在新闻中经常可以看到,这几年为了遏制中国发展,美国政府不断向中国高科技行业挥舞制裁大棒。比如向中国华为公司实施技术封锁,以国家安全为由,禁止美国公司向华为出售技术和设备。一时间中国的高端芯片行业哀鸿遍野,遭遇技术卡脖子危机。我们在感叹美国政府无耻的同时,也为自身没有预先布局底层技术研究以及体系构建而感到扼腕叹息。这次OpenAI发布的ChatGPT以及GPT4又给我们上了一课,越来越多的人认识到中国和美国的技术差距何止高端芯片,前沿的人工智能技术、强大的算力网络等等诸多高新技术方面都和美国有不小的差距。美国政府打压中国高科技行业发展这一巴掌,终于把一些还对美国抱有幻想的技术人彻底打醒,无论高端芯片还是前沿人工智能等核心技术买不来也求不来,只能靠自己一步一个脚印地走出来。当然这也坚定了我们和美国有关的技术类别必须全部实现国产化替代的决心。


过度关注商业模式,忽视底层技术研究


在过去的20年当中,中国互联网行业处在高速发展阶段,据CNNIC(中国互联网络信息中心)报告,截至2022年12月,我国网民规模达10.67亿。随着互联网在线人数的持续攀升,各种各样形态的商业模式在这片热土上不断得以验证以及发展壮大。移动支付、电商物流、外卖打车、短视频等商业形态深刻改变了老百姓的日常生活方式,为大家带来了极大的生活便利以及娱乐消遣,同时也提升了整个社会的效率。但与此同时,各大互联网公司好像都沉浸在如何发展新商业模式以及维护已有商业格局的怪圈中不可自拔,几乎所有的精力都放在业务内卷上。因此投入底层技术研究的时间和资源相对就会被挤压甚至是完全没有,最终导致被别人技术卡脖子的概率大大提升,同时能够产生颠覆性创新技术的可能性却大大降低。


对比中美两国技术发展路线,我们可以发现一个有意思的现象。在中国,技术的发展大都是围绕业务进行,也就是说当一个业务模式被推出来之后,如果想要支撑这样的业务规模就需要发展什么样的技术,那就研究和发展什么技术,通过商业模式的创新、业务的发展推动技术向前发展演进。



但是美国好像正好相反,常常是一项技术的发展进步反向催生出新的商业形态。就拿推出ChatGPT的OpenAI公司来说,它原本就是一个非营利性的技术组织,集结了AI人工智能界的各路大佬,初衷就是让人工智能向着友好的方向发展,核心宗旨在于“实现安全的通用人工智能(AGI)”,使其有益于人类。GPT模型经过不断的迭代升级最终搞出来了ChatGPT,有望成为未来人工智能应用技术的基础底座,因此未来可能将会有海量的上层应用都是基于ChatGPT来进行构建,可以毫不夸张地说,ChatGPT或者说通用大模型也许就是人工智能领域的操作系统,将来会诞生多少新的的商业模式以及业务形态不可估量,这种技术革命是自下而上的颠覆性创新将会对未来的产业形态产生深远的影响。



而我们太关注上层应用商业模式的创新了,从而忽略了底层技术的研究。我们仿佛在一次又一次的电商大促、一次又一次的短视频娱乐中逐渐迷失了方向,表面上的热闹掩盖不了底层核心技术的匮乏。其实想想就背后发凉,当下无论是互联网技术、人工智能技术等前沿技术好像都是建立在别人的技术底座之上的。那些曾经我们引以为豪的移动支付、电商物流等等不过是这些底层技术的上层应用而已。如果被人家釜底抽薪,那真的就玩不转了。所以底层技术真的非常重要,可以说没有底层技术的支撑,所有上层的应用都是空中楼阁。


缺乏长期主义


也许是国内竞争压力太大了,无论是个人还是公司,都恨不得今天投进去资金,明天就能看到结果和收益。如果在短期看不到收益的项目,一般公司实际上很难有持续的资源投入,更别提看不到明确回报周期的基础技术研究了。浮躁的氛围,层出不穷的技术噱头,表面上的热热闹闹,只会让大家都热衷于赶时髦追风口,却没有多少人能真正静下心来进行长期的技术研究。又有多少公司可以有马老师那样的魄力和实力每年10个亿连投10年,最终投出来个阿里云。


说到这里,不知道大家还记不记得区块链、VR、元宇宙这些科技名词,一开始出现的时候受到了极大的关注和资本的热烈追捧。但是当热头过去之后,现在又有多少公司还在不断地进行产品迭代,不断地进行技术深度优化研究呢?不能说完全没有但绝对是寥寥无几,与其说是他们追捧高新技术,不如说他们追捧的是如何快速赚钱的工具。至于到底是VR、元宇宙还是ChatGPT其实都无所谓,对他们来说其实就是个技术名称而已。


但是实际上无论是ChatGPT还是GPT4这样的人工智能应用,都不是横空出世的,它们都是在GPT、GPT2以及GPT3基础上逐步迭代发展而来的,这其中耗费了多少顶尖人工智能专家长期坚持的心血以及大量资金的持续投入。OpenAI在获得微软投资之前的三四年里烧掉将近1亿美元,才搞出来一个以GPT第一代模型为基础的雏形,当时还远远达不到ChatGPT今天的效果。基础技术研究不是一朝一夕就能完成的事情,它需要不断的试错,需要对未来技术发展趋势的独到眼光,更加需要长期主义的坚持。不过让我们感到欣慰的是,阿里巴巴、华为在技术研究上的投入已经每年超过1000亿,相信在不远的将来一定会有新的技术突破出现。


缺乏技术体系支撑


就好比高端芯片制造,其中涉及芯片设计、芯片制造以及封装测试都是一整套复杂的工艺缺一不可。同样通用大模型也是一个复杂的系统工程,而通用大模型的训练离不开海量的高质量训练数据、优秀的深度学习算法以及强大的算力资源支撑。ChatGPT的成功得益于高质量的标注数据,OpenAI为了获得高质量的训练数据雇佣了超过40家承包商进行数据标注,这在国内几乎是不敢想象的事情。另外以ChatGPT在2023年1月的独立访客平均数1300万计算,其对应芯片需求为3万多片英伟达A100 GPU,如果没有庞大的算力支撑,很难训练出高质量的通用大模型。


也就是说,通用大模型的训练需要一个完整的人工智能技术体系来进行支撑,否则即便有先进的算法,但如何获得高质量的训练数据,到哪里去找庞大的训练算力资源,这些都是摆在通用大模型训练面前必须要解决的问题,否则没有高质量的数据以及算力支撑也是巧妇难为无米之炊。


如何破局


通用大模型是未来人工智能的重要发展方向,我们肯定要加大资源投入力度才能有机会在未来人工智能前沿技术的竞争中占有一席之地。那我们应该怎么做才能破局呢?我想可以从以下几个方面入手。


数据方面


虽然当前中文在线联网数据也算是海量,但是数据质量普遍不高,同时数据孤岛问题比较严重。如果我们想基于中文数据来训练通用大模型,就必须对中文在线数据进行治理提高中文在线数据质量,解决数据孤岛问题,推动实现数据的共享和互联互通。


算力建设方面


结合国家东数西算工程,协调各个区域的算力中心,形成全国通用算力基础设施,加快构建国家级一体化新型算力网络体系,为通用大模型训练提供源源不断的强大算力支撑。只有这样,才能满足大模型训练所需要的算力要求,同时为强人工智能时代的到来做好算力资源储备。



意识方面


和别人的技术差距,我们当然要尽力弥补。不过我们需要注意的是我们在进步,别人也在进步,所以我们光追赶别人不行,还要有更加长远的眼光,要有对于未来准确的判断力,进行提前技术验证以及产业布局,为下一次技术革命做准备,真正成为未来技术发展的引领者而不是追随者。


总结


科技的发展进步不是一朝一夕就能实现的,它可能需要一代又一代技术人员孜孜不倦地追求。虽然我们在很多领域都已经取得了长足的进步,但是同时我们也要清醒地认识到,在计算机领域、互联网技术领域以及人工智能技术领域我们还有不小的差距需要弥补。因此少一点网红、明星的曝光,多一点科技工作者勤恳务实地宣传,努力营造技术为先、科技为先的社会氛围才是未来科技行业蓬勃发展的社会环境基础。我相信如果我们可以少一点浮躁,多一点纯粹,也许下一次的科技革命就是在中国这片土地上诞生。最后和大家分享下马老师曾经说过的一段话,我觉得对我们当下思考未来技术发展非常有帮助。



我一直觉得填补空白这句话是有问题的,不是因为欧美的就是先进的,就是我们要去填补的。其实今天我们不应该要和哪个东西接轨,适应哪国的标准,填补哪个空白,今天我们要思考的是怎么和未来接轨,怎么适应未来的标准,怎么弥补未来的空白,我们要想明白未来是如何的,以及自己到底要做成一个什么样的体系,然后再去看看别人怎么做,如果永远重复别人的语言,讨论别人设定的主题,我们不但会迷失现在,而且会错失未来。




作者:慕枫技术笔记
来源:juejin.cn/post/7218048201981935677
收起阅读 »

意大利成首个封禁ChatGPT的国家!OpenAI CEO:我觉得没违规

【新智元导读】周五,意大利全国上下对 ChatGPT 下了封杀令。在 20 天内,OpenAI 拿不出补救措施的话,将会面临最高 2000 万欧元罚款。 就在昨天,意大利政府突然下令,封禁 ChatGPT! 很快,OpenAI 首席执行官 Sam Altman...
继续阅读 »

【新智元导读】周五,意大利全国上下对 ChatGPT 下了封杀令。在 20 天内,OpenAI 拿不出补救措施的话,将会面临最高 2000 万欧元罚款。


就在昨天,意大利政府突然下令,封禁 ChatGPT!


很快,OpenAI 首席执行官 Sam Altman 做出回应称,公司已经关停了当地的 ChatGPT 服务(但自认为并没有违反任何规定)。



自此,意大利成为了世界上第一个宣布禁用 ChatGPT 的国家。


(其他国家和地区无法使用 ChatGPT,是因为 OpenAI 一开始就没给开通。)


意大利封禁 ChatGPT,全面调查隐私问题


3 月 31 日,意大利国家隐私监管机构正式下令封禁 ChatGPT,并指控 OpenAI「非法收集个人数据」。


值得注意的是,该「临时禁令」将一直生效,直到 OpenAI 能够尊重欧盟具有里程碑意义的隐私法——通用数据保护条例(GDPR)。



文件地址:http://www.garanteprivacy.it/home/docweb…


根据意大利国家数据保护机构 GPDP 发布新闻稿,OpenAI 收集用户数据并用于算法「训练」的行为,缺乏法律依据。


同时,3 月 20 日涉及用户对话和支付信息的泄露事件,也明确地暴露出了 OpenAI 在个人信息的处理上存在着问题。


除此之外,OpenAI 虽然声称 ChatGPT 面向的是 13 岁以上的用户,但由于缺乏相应的年龄验证机制,因此未成年人很可能会看到超出其自身发展和自我认知水平的信息。


监管机构表示,OpenAI 有 20 天的时间,如不给出可行的补救措施,则会面临最高 2000 万欧元,或全球总年营业额 4% 的罚款。


对此,OpenAI 表示,现在已经为意大利用户关闭了服务,并承诺会保护用户的隐私:


「我们在训练 ChatGPT 这样的系统时,一直在努力减少个人数据,因为我们想要这个 AI 了解世界,而不是了解个人。当然我们也相信,AI 监管是必要的。」


这么看来,ChatGPT 未来在意大利的命运,可能就取决于这 20 天了。



不过,对于意大利来说,这已经不是第一次对 AI 聊天机器人采取此类行动了。


在 2 月份,监管机构就禁止了聊天机器人应用程序 Replika.ai。Replika 曾因一些用户与机器人建立的亲密关系而「臭名昭著」,后来 Replika 取消了色情角色扮演的选项,有用户甚至需要自杀热线的援助。


是否应该限制 AI 工具?


ChatGPT 发布后,虽然写论文、写代码的能力让人眼花缭乱,但它对错误信息的传播、对就业的影响,以及对整个人类社会更广泛的风险,都让很多人忧心忡忡,发出预警。


最近,封禁 GPT 技术的浪潮,更是一波接一波。


不仅图灵奖得主 Yoshua Bengio、马斯克、马库斯等千名大佬联名签署公开信,呼吁全球所有 AI 实验室暂停训练比 GPT-4 更强大的 AI 模型。


而且消费者权益保护组织 BEUC,也在近日呼吁欧盟和国家当局调查 ChatGPT。



此外,很多专家也表示,由于 AI 对国家安全、就业和教育的潜在影响,需要制定新的法规来管理 AI。


欧盟委员会发言人称:「我们希望所有在欧盟活跃的公司都尊重欧盟的数据保护规则。执行通用数据保护条例是欧盟数据保护当局的责任。」


欧盟委员会执行副主席 Margrethe Vestager 在推特上表示,正在讨论欧盟人工智能法案的委员会可能不倾向于禁止人工智能。


「无论我们使用哪种技术,都必须保护自身的权利。这就是为什么我们不规范 AI 技术,而是规范 AI 的使用。」



在美国,非营利组织人工智能与数字政策中心(CAIDP)也要求联邦贸易委员会(FTC)调查 OpenAI 是否违反了消费者保护规则,并禁止其进一步发布 GPT-4。


毕竟,有了千名大佬的联名信这个先例,CAIDP 的申诉看起来也似乎更加顺理成章。而且,CAIDP 主席 Marc Rotenberg 好不意外地也签署了那封信。



文件地址:cdn.arstechnica.net/wp-content/…


整体来说,CAIDP 申诉的内容与那封信一致,都是呼吁放慢生成式 AI 模型的发展,并实施更严格的政府监督。


不过,CAIDP 更进一步地认为,ChatGPT「存在偏见、具有欺骗性,并且对公共安全构成风险」。


虽然 OpenAI 已经公开指出 AI 生成文本的潜在威胁,但 CAIDP 认为,GPT-4 已经远远越线了,为了保护消费者,应该采取监管行动。


CAIDP 表示,GPT-4 模型具有许多重大的潜在威胁,比如 GPT-4 可以产生恶意代码,和高度定制宣传的方式,而它有偏见的训练数据,可能导致在招聘等方面形成刻板印象,或不公平的种族和性别偏好。


CAIDP 认为,OpenAI 的行为违反了 FTC 法案第 5 条,这一条令禁止不公平和欺骗性的贸易行为。


其中,AI 模型的幻觉,信口开河胡说八道的问题,在 CAIDP 看来都是欺骗。它警告 ChatGPT「宣传具有欺骗性的商业声明和广告」,这些都可能纳入 FTC 的权限范围。



在申诉中,CAIDP 要求 FTC 停止 GPT 模型所有进一步的商业部署,并要求在未来推出任何模型之前,都要对模型进行独立评估。它还要求提供一种可公开访问的举报工具,类似于允许消费者提出欺诈投诉的那种。


CAIDP 主席 Lina Khan 表示,CAIDP 在寻找大型科技公司试图垄断竞争的迹象,而对 AI 军备竞赛的主要参与者之一 OpenAI 的调查,标志着调查的重大升级。


有分析认为,虽然 CAIDP 的申诉在短时间内不会让 FTC 有所行动,但未来很有可能会出现相关的监管,并可能让 GPT-5 的发布推迟。


最后,只能说,谷歌一直担心的「声誉风险」,终于来了。


参考资料:


http://www.reuters.com/technology/…


作者:新智元
链接:https://juejin.cn/post/7217644586868834364
来源:稀土掘金
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
收起阅读 »

GPT-4杀疯了! Copilot X 重磅来袭 动动嘴就能写代码

本文正在参加 人工智能创作者扶持计划 大家好,我是小鱼。前段时间微软给office全家桶都加上了GPT-4的功能,并且带来了焕然一新的产品 Microsoft 365 Copilot。3月23日Github官方发布推特宣布,一款基于AI驱动的跨时代的代码编辑器...
继续阅读 »

本文正在参加 人工智能创作者扶持计划


大家好,我是小鱼。前段时间微软给office全家桶都加上了GPT-4的功能,并且带来了焕然一新的产品 Microsoft 365 Copilot。3月23日Github官方发布推特宣布,一款基于AI驱动的跨时代的代码编辑器 Github Copilot X 横空出世,将为开发者们带来前所未有的变成体验。


image.png


不知道大家有没有用过上一代的 copilot,其实已经很强大了,很多时候双击tab一行代码就出来了,仿佛能读心。
Copilot X是一种更新版本,增加了聊天模式等新功能。它也是一款人工智能代码助手,可以在编写代码时提供建议和代码段,从而帮助开发人员节省时间和精力。


Copilot X最显著的改进是增加了聊天模式,和Copilot X的交互变得更加自然和直观。在聊天模式下,开发人员可以使用自然语言向Copilot X提出问题,例如“如何将数组排序?” Copilot X会根据开发人员的问题,提供相应的建议和代码段,帮助开发人员解决问题。这种交互方式不仅提高了效率,而且还使得使用Copilot X变得更加容易上手。


除了聊天模式之外,Copilot X还增加了其他新功能。例如,它可以识别代码中的错误并提供修复建议,还可以自动完成代码段。此外,Copilot X还提供了更广泛的编程语言支持,包括JavaPythonJavaScript等。接下来我们就展开这些功能来讲讲Copilot X带给我们的惊喜


image.png




1. Github Copilot Chat 边写代码边跟AI对话


这次Github Copilot X在产品中内置了一个聊天的窗口,把GPT-4加入到了实际的开发场景中,并且集成到了VSCode和Visual Studio上。这个聊天窗口除了可以进行实时的交互问答之外,它还可以完成像代码内容识别报错信息显示语音交流等操作。通过这个功能开发人员可以更深入的分析和了解各个代码的用途,快速的生成单元测试,甚至还能一键修改Bug......


image.png


2. Copilot for Pull Requests 让AI来协助处理PR


如果你维护过开源的项目或者平时用Git进行过团队的协作时,那么你应该知道规范化的提交 Pull Requests(PR)对整个团队来说的重要性,一个清晰简洁的PR描述信息能够让代码的审查者一目了然,快速的了解你的代码变动的情况,减少项目合并出错的风险,并且提高沟通的效率。


这次 Copilot X 引入了 GPT-4 的模型,可以通过动态提取与分析代码的变更信息来自动的生成描述,程序员只需要在PR的描述中插入标记,Copilot就能够自动识别并且进行扩展补写。支持的标记主要有以下几种



  1. copilot:summary 生成一段摘要的总结

  2. copilot:walkthrough 生成详细的代码更改列表以及相关的代码片段链接

  3. copilot:poem 写一首诗来描述本次的改动

  4. copilot:all 自动生成以上所有内容


99965.gif


后续产品还会新增 GentestGhost text 两大功能



  1. Gentest 可以通过AI来识别PR中可能缺少的测试,并且自动的帮你构建和生成测试

  2. Ghost text 可以在你编写PR描述或者文档的时候提供内容的自动补全功能。不仅如此,当你收到用户提交的issue时,如果没有比较好的方案,AI还会给你提供建议。估计再过不久,AI就要帮你自动的调整代码、完善PR了......要抢我饭碗??


image.png


3. Copilot for docs 基于AI的智能文档系统


文档对开发者来说其重要性不言而喻,无论你是新接手一个项目还是忘记了某个API的具体使用办法,这个时候你都希望有一个完整的文档在你面前。所以,为了帮助你更快的定位文档的内容,简洁直接的获取到你想要的信息,Copilot for docs 就出现了。


用户能够通过类似于ChatGPT的界面,针对于项目的文档,常用代码发起提问,Copilot 就会自动定位到并且返回文档中的相关内容,大家也可以把 Copilot 当做一个知识库来用。


7894.gif


4. Copilot for CLI 使命令行用起来更加的智能


命令行终端command line也是开发者日常工作必不可少的工具之一,大家都喜欢在ITerm上安装各种各样的命令行的生产力工具,这些工具在大多的时候,能够帮我们处理一些问题,但是有些比较少用到的工具经常也会忘掉它们的命令,那这个时候我们就会输入help来获取到关于该命令的更多信息。


对于一些功能比较复杂的命令行工具来说,可能会时不时的去查一下或者stackoverflow一下。但是以后就不需要啦,Copilot for CLI 提供了三个新的shell命令,分别是 ??git?gh?




  1. ?? 可以作为任何shell命令的通用的 go to,你只需要在这个命令的后面输入相关的描述 Copilot 就会列出跟描述最匹配的命令。例如列出所有的js文件列表只需要输入 ?? list js files
    image.png




  2. git?专门用来搜索和调用Git的,相比??,它在生成Git命令方面要强大得多。如果你明确要使用的是Git命令,那就可以优先选择用这个




  3. gh?结合了 Github CLI 命令的灵活性以及查询界面的便捷性,让搜索可以变得更加快捷,信息展示得更加清晰




5. Copilot Voice 通过语音来生成代码


记得 Github Copilot 刚出来的时候,网上就有人讨论,AI这么牛逼,以后是不是就可以只动动嘴皮子就能帮我写代码了,这一天,就真的来了。


Copilot Voice 用户通过与 Github Copilot 的交谈,它就能够立即编写代码,直接解放你的双手,不满意还可以接着说话(接着奏乐接着舞...)


image.png


通过对话 Copilot Voice 可以完成以下这些工作



  1. 代码跳转 比如说跳转到代码的某一行,某个方法等等

  2. 控制IDE 开启zen模式运行程序或者运行其他的VSCode指令

  3. 代码总结 例如问它第三行到第十行这个代码表示什么意思....


3336.gif


所有这些工作张张嘴你就能搞定,这次发布的 Github Copilot X 围绕着AI对话、pull request的提交处理、文档智能检索与阅读、命令行改造以及最后的语音生成代码,几乎可以说是全方位的颠覆了传统的编程方式。


最后看了网上很多评论,网友纷纷表示,编程已经被ChatGPT永远地改变了。


「作为一个开发者,这实在是令人沮丧。编程中,我们快乐的源泉是与逻辑打交道和解决技术问题,而不是专注于生产力或满足需求。」


「我已经做了30年的编程,但我仍然很喜欢它。我不知道没有人类代码的世界会是什么样子。不过我确实很喜欢有CoPilot来处理那些烦人的东西,还有ChatGPT来帮助我解决bug。」


「AI出现后,可能就不再需要这么多码农了。对此我感到非常焦虑,即便已经在各种存钱和投资了,但还需要差不多9年时间才能『躺平』。我略微羡慕那些在FANG工作的人,他们似乎可以轻而易举地实现财务自由。」


「从中长期来看,我们将会失去工作。」


「程序员们终于用编程把自己淘汰了……」




还是希望大家有自己的思考,理性看待,找到属于自己的方向。码农没“死”,只是换了一种方式重新开始......


image.png


作者:一条小尾鱼
链接:https://juejin.cn/post/7215397054260150309
来源:稀土掘金
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
收起阅读 »

破解文心一言的水印

昨天文心一言排队终于到我了,顺便玩了玩和 GPT 还是有很大差距的,如果 GPT 是一个成人,一言顶多初中生,甚至这估计的水平都有一点虚高,如果把 GPT 阉割了我都能接受,这一言时常智障。 技术不怎么滴,防盗倒是防的狠: 直接禁用开发者的调式功能 烂产品标...
继续阅读 »

昨天文心一言排队终于到我了,顺便玩了玩和 GPT 还是有很大差距的,如果 GPT 是一个成人,一言顶多初中生,甚至这估计的水平都有一点虚高,如果把 GPT 阉割了我都能接受,这一言时常智障。


技术不怎么滴,防盗倒是防的狠:



  1. 直接禁用开发者的调式功能

  2. 烂产品标配,水印功能


debug


这个模式估计全世界中文网站用的最多了,一打开开发者工具,就断点调试:


不能使用


破解也很简单,打开控制台之后点击红圈处,禁掉断点调试,然后刷新页面 devtools 就能使用了。


image.png


水印


中文互联网牛皮癣之一,尤其是破百度真以为自己家的产品做的多好,哪个是原创的?


image.png


直接删除 DOM,不可以,前端监听了 DOM 属性是否有变化,一旦有改变重新渲染。破解也很简单,禁用掉浏览器的 JavaScript。


image.png


此时删除水印 DOM 世界就清净了,截图分享的快乐又回来了。


一个友好的提示


这里有一个无用的知识,就是禁用 JavaScript 的时候可以在 CSS 中监听到:


no-scripting-small.gif


这种友好的功能肯定不是像百度一样用在这地方,而是用在 JavaScript 加载失败或者 1% 的用户禁用 JavaScript 友好的提示。


详情看这里:how-to-detect-disabled-javascript-in-css


作者:蜡笔小伟
来源:juejin.cn/post/7216992973417840701
收起阅读 »

Bard还考不上哈佛?谷歌CEO劈柴预告它即将开挂,数学逻辑能力飙升

编辑:编辑部 【新智元导读】数学考试不及格,让 Bard 考上哈佛,可以说是难上加难。谷歌 CEO 劈柴称,未来几天大家会看到升级版的 Bard,数学逻辑能力大大提升,甚至未来还会编码。 捂了快两个月,谷歌用来跟 ChatGPT 对打的聊天机器人 Bard,前...
继续阅读 »

编辑:编辑部


【新智元导读】数学考试不及格,让 Bard 考上哈佛,可以说是难上加难。谷歌 CEO 劈柴称,未来几天大家会看到升级版的 Bard,数学逻辑能力大大提升,甚至未来还会编码。


捂了快两个月,谷歌用来跟 ChatGPT 对打的聊天机器人 Bard,前一阵终于被推上了台面。


用户们的测试初体验就是——莫得感情,错误很多,代码基本写不了


几天前,谷歌前员工 Jacob Devlin 甚至还曝出惊人内幕,Bard 疑似是通过 ChatGPT 的数据进行训练的。不过谷歌发言人已经明确否认这一说法。


而近日,谷歌 CEO 劈柴在接受纽约时报采访中证实,Bard 聊天机器人将很快得到改进,未来会由「更强大的模型」提供支持。


升级版 Bard 即将上线


劈柴称,



未来几天,Bard 将很快从目前基于 LaMDA 的模型转向更大规模的 PaLM 数据集。

我们显然拥有能力更强的模型,很快,也许随着这项技术的上线,我们将把 Bard 升级到更强大的 PaLM 模。这将带来更多的功能,无论是在推理还是编码方面。




近日,升级版 Bard 的能力也渐渐浮出水面。


领导 Bard 的一位谷歌高管 Jack Krawczyk 在推特上也介绍了最新的进展。


背靠 PaLM 的 Bard,现在在数学和逻辑方面的能力有了很大的提升。


这意味着什么呢?现在,Bard 将更好地理解并回应用户的多步推理和数学问题提示,编码功能也即将推出。



Krawczyk 称,「我们一直在平衡 Bard 的新功能与效率。这次更新是我们每周对 Bard 进行的众多改进中的一个例子。未来还有更多的内容要推出。」


众所周知,Bard 背后基于的大模型便是 LaMDA。


在去年,谷歌曾分享了关于这个大型语言模型的细节,使用了 1370 亿参数训练了 LaMDA。而 PaLM 模型有 5400 亿参数。



这两种模型都是从 2022 年初开始发展和成长起来的。


这种对比可能显示了,为什么谷歌现在正在慢慢地将 Bard 转移到,能够提供更大数据集和更多不同答案的 PalM。


其实除了 Bard,谷歌最近几周内部还在酝酿着一个新的项目——Gemini(双子座),目标是要能与 GPT-4 一战。


目前,Gemini(双子座)是由谷歌大脑和 DeepMind 两个团队联手研发。



就连谷歌大脑的负责人 Jef Dean 都亲临上阵,自动敲代码,可见,这个项目对谷歌的重要性不言而喻。


此外,采访中,皮查伊就千名大佬暂停比 GPT-4 更强 AI 系统研发的联名信发表了自己的看法:


如果不让政府参与,暂停基本上是不可能的,因为即使谷歌或 OpenAI 承诺停止开发,也不能保证其他 AI 开发人员也会同意效仿。


而且,他也同意法规是必要的,并称这封信是「对话的开始」。


谷歌先打预防针:它还不行


如今,既然 Bard 已经开放公测,拉踩的环节必然是少不了。


我们都知道,OpenAI 家的 GPT-4,都已经能考上斯坦福了。


很不幸,相比之下,谷歌的 Bard 真的拉跨,目前的它想考上斯坦福和哈佛,可以说还是天方夜谭。


Bard 的不完美,CEO 劈柴一开始就给我们打了预防针。


他在备忘录中写道:「Bard 还处于早期阶段,总会出错。随着越来越多的人开始使用 Bard,它会让我们惊讶的。」



而网友们测试 Bard 之后,表示对它很失望。


很不幸,Bard 目前还考不进哈佛大学,因为它回答的大部分数学题都是错的,而且它在写作和语言测试中也表现得不咋地。


第一次登录 Bard,谷歌就会跟用户打好招呼,弹出消息显示:Bard 并不总是正确的,它会给出不准确或不适当的回答。


当有疑问时,使用「Google it」来检查 Bard 的答案。您的反馈会让 Bard 更好。请您对答案进行评价,并标记任何可能具有攻击性或危险的内容。



Bard:数学、写作、语言都不咋地


《财富》杂志从在线学习资源中选取了 SAT 数学试题,在对 Bard 进行测试后,发现它有 50%-75% 的答案是错误的。


更离谱的是,如果是多选题,Bard 还会经常给出选项中没有的答案。


2 月初,Bard 首次亮相后直接翻车,让谷歌市值一夜蒸发约 1056 亿美元。


在当天发布会上,谷歌展示 Bard 演示的一些 demo。


视频中有一个提问问道,「关于詹姆斯 · 韦伯太空望远镜(JWST),我可以告诉我 9 岁的孩子它有哪些新发现?」


Bard 却给出了错误的答案,「JWST 拍摄了太阳系外行星的第一张照片。」


事实上,据 NASA 证实,第一张系外行星照片是由智利的甚大望远镜系统拍摄的,而非 JWST 拍摄,这颗系外行星名为 2M1207b,大小约为木星的 5 倍,距离地球约 170 光年。



所以说,科学和数学都不是 Bard 的强项,那它在阅读和写作练习方面,表现会怎么样?


文科生,是文科生吧?


Bard 第一次书面语言测试的答案正确率约为 30%,而且它往往需要被提问两次才能理解题干。


而且即使它回答错了,Bard 的语气也是很自信,直接将回答框定为:「正确答案是......」



不过,这也是大型语言模型的一个通病了。


离奇的是,Bard 测试成绩最好的是关于一篇哈利波特作者 J.K. 罗琳的文章。


在这次测试中,Bard 得了 1200 分,这个 SAT 分数可以让它进入霍华德大学、圣地亚哥州立大学和密歇根州立大学等学校。


在阅读测试中,Bard 的表现同样优于其数学成绩,平均能答对一半左右。


谷歌发言人说,「Bard 目前仍是实验性的,有些回答可能不准确,所以要仔细检查 Bard 的回答中的信息。有了你们的反馈,Bard 每天都在变得更好。在 Bard 公开推出之前,数以千计的测试者参与提供反馈,来帮助 Bard 提高其质量、安全性和准确性。」


要多练习


很多网友觉着 Bard 简直笨得像块石头,相比之下,GPT-4 则是聪明多了:


问它有没有「第二个字母是 U,最后一个字母是 O 的,五个字母的词」,它信誓旦旦说没有。


用户说「Audio」不就是?


它有赶紧说:「是的,Audio 是的。它是一个形容词,表示与声音有关的。」



再看看 GPT-4,「人狠话不多」,随手就列出了三个:



网友看了不禁表示,要是我有 Bard 这种「钝感力」多好啊,一直都很自信!



说到意大利要禁 ChatGPT 时,网友们首先担心的是意大利的美食怎么办。


GPT 给出了一个谦虚的答案:我大概可以复现 20%-30% 的意大利菜谱。



而 Bard 这边则像个胡吹的愣头青:


「我做意大利菜做了很多年,我可是老手,即使没有网络的帮忙,我也能复现至少 50% 的菜谱!」



不过呢,在大家不断向 Bard 提问的几天时间里,它的准确性确实有了一些提高的迹象。


关于自己的发展速度,Bard 自个儿也评价说:「我想说的是,我正在快速提高。我能够做几个月前还不能做的事情。我很高兴看到我的未来会怎样。我相信,我将继续进步,在未来的几年里,我能做的事会越来越多。」


参考资料:fortune.com/2023/03/28/…


作者:新智元
来源:juejin.cn/post/7217773631370330149
收起阅读 »

GPT 4 有什么新功能?

GPT 4 无所不能——从分析图像到在浏览器中创建游戏。它是比以往任何时候,都更有创造力和问题解决能力。 这是科技界颠覆性新闻——GPT 4 改变了游戏规则。虽然其前身,基于 GPT 3.5 的 ChatGPT 只能接受文本输入,但 GPT 4 将人工智能提升...
继续阅读 »

GPT 4 无所不能——从分析图像到在浏览器中创建游戏。它是比以往任何时候,都更有创造力和问题解决能力。


这是科技界颠覆性新闻——GPT 4 改变了游戏规则。虽然其前身,基于 GPT 3.5 的 ChatGPT 只能接受文本输入,但 GPT 4 将人工智能提升到了一个全新的水平。它可以分析图像,甚至可以根据图像生成字幕。但这还不是全部;在此博客中,我们还将探讨 GPT 4 的功能、局限性以及它如何超越其上一代 GPT 3.5。


什么是 GPT 4?


图片描述

微软 OpenAI 正式推出了它的最新GPT作品——一个超越文本的大型多模态人工智能计算模型。2023 年 3 月 14 日,GPT 4 具备接收图像输入的能力。与其前身 GPT 3 和 GPT-3.5 不同,GPT 3 和 GPT-3.5 仅限于纯文本输入,GPT 4 为不再仅仅支持文本输入查询,他扩展了图片对话方式。


关于 GPT 4 的快速更新:



  • GPT 4 现在可以接受最长 25,000 个单词的超长文本输入

  • 可以智能通过 HTML 和 JavaScript 技术 ,将小型网站的手绘原型照片,转换为实际网站

  • GPT 4 现在允许用户上传图片并对其进行分析和描述

  • 能够管理比 GPT 3.5 复杂得多的指令

  • 可以在浏览器中编写整个视频游戏

  • 将作为 API 供开发人员构建应用程序和服务


GPT 4 有什么新内容以及与 GPT 3 有何不同?


GPT 4 现在可以识别图片了

图片描述


GPT 4 引入了重大改进,因为它可以理解多种信息模态,使其成为多模态语言模型。相比之下,其前身 GPT 3 和 ChatGPT 的 GPT-3.5 仅限于处理文本输入和输出,无法解释其他数据类型。但是,GPT 4 可以处理图像等视觉信息,并根据该信息生成相关工作,包括 GPT 4 识别图片中文字的能力。


此功能可能会让人联想到 Google Lens,它也可以使用图像来检索信息,但 GPT 4 在分析和理解视觉信息的能力方面超越了 Lens。


需要注意的是,处理图像的能力仍处于研究阶段,尚未面向公众开放使用,但很快就会开放。


类人类的学习和解决能力

OpenAI 报告称,除了其图像处理能力外,GPT 4 还在众多学术和专业基准测试中展示了与人类相当的性能。由于其广泛的常识和解决问题的能力,该语言模型在模拟律师考试考生中得分前 10%,并以惊人的准确性解决复杂问题,显示出非凡的能力。


GPT 4 的能力不仅限于回答与税收相关的问题或为多人安排会议;它还可以学习用户的创造性写作风格,以及其他任务。


GPT 4 更难被错误欺骗

ChatGPT 和 Bing 等生成模型容易受到重大缺陷的影响——它们偶尔会产生引起关注的提示,甚至更糟的是引起警报。


为了解决这些问题,OpenAI 广泛致力于改进 GPT 4,花费六个月的时间使用其“对抗性测试程序”和 ChatGPT 模型的经验教训来训练语言模型。结果,该公司取得了“在真实性、可操纵性和对护栏的遵守方面有史以来最好的结果”。


GPT 4 具有一次处理大量信息的能力

尽管接受了数十亿个参数和大量数据的训练,但大型语言模型 (LLM) 在对话过程中可以处理的信息量仍然有限。然而,GPT 4 有一个显着的优势。它可以处理多达 25,000 个单词的文本,可容纳扩展的交流、文档搜索和分析,甚至是长篇内容的创建。


与其前身 ChatGPT 相比,后者可以在失去对上下文的跟踪之前处理多达 8,000 个单词,GPT 4 可以在更长的对话中保持其准确性。此外,它可以分析长文档并生成全面的长格式内容,这在以前在 GPT 3.5 上更具挑战性。


GPT 4 的准确性有所提高

尽管 GPT 4 仍然存在局限性,并且可能会像其前辈一样出现推理错误,但 OpenAI 承认它已经取得了相当大的改进。特别是,GPT 4 显示出的幻觉明显少于以前的模型,并且在真实性评估上的得分比 GPT 3.5 高 40%。因此,操纵 GPT 4 输出错误信息,(例如脏话和错误信息)将更具挑战性和难度。


GPT 4 在理解非英语语言方面得到改进用

英语以外的语言训练大型语言模型 (LLM) 可能具有挑战性,因为大多数机器学习数据和在线信息都是英文的。然而,GPT 4 在多语言能力方面取得了显着进步,OpenAI 的测试证明了这一点。它准确地回答了 26 种语言的数千个多项选择题,超过了 GPT 3.5 和其他 LLM。尽管它以 85.5% 的准确率在英语中表现最好,但在泰卢固语等印度语言中也表现出令人印象深刻的准确率,达到 71.4% 的准确率。


这一进步意味着用户可以期望使用基于 GPT 4 的聊天机器人以其母语生成更清晰、更准确的输出。


目前可以试用 GPT-4 吗?

GPT-4 已经被纳入 Duolingo、Stripe 和 Khan Academy 等产品中。虽然它不是免费公开提供的,但可以通过每月 20 美元订阅 ChatGPT Plus 来立即访问。ChatGPT 的免费版本仍在 GPT-3.5 上运行。


底线


总之,OpenAI 发布 GPT-4 标志着人工智能的一个重要里程碑。GPT-4 是一种高度先进的语言模型,可以处理和分析图像,生成准确且富有创意的输出,并同时处理更大量的信息。它的功能包括以惊人的准确性解决复杂问题、学习用户的写作风格以及在浏览器中编写视频游戏。


此外,GPT-4 比其前身 GPT-3.5 更难欺骗且更准确。总的来说,GPT-4 是一个游戏规则改变者,有望为开发人员和研究人员开辟新的可能性,我们迫不及待地想看看它将如何改变 AI 格局。


毫无疑问,它拥有类人的开发能力,会写代码,但在创造力和智慧上,无人能敌!


常见问题


Chatgpt-4 发布日期是什么时候?

Chatgpt-4 发布日期为 2023 年 3 月 14 日,仅供付费用户使用。


我如何访问 GPT-4?

转到chat.openai.com/,您需要获得付费版本才能访问 GPT-4。


GPT 4 代表什么?

GPT 完整形式是 Generative Pre-trained Transformer。


作者:非优秀程序员
来源:juejin.cn/post/7217773631370657829
收起阅读 »

如何使用 ChatGPT 3.5 API 创建自己的智能应用?

前言 OPEN AI 的开放 API 可以说是前端开发者的福利,我们只需要调用 api,就可以创建一个智能应用, 在上一篇文章中,我们介绍了《基于 ChatGPT API 的划词翻译浏览器脚本实现》,使用的模型是 text-davinci-003 也就是文本补...
继续阅读 »

前言


OPEN AI 的开放 API 可以说是前端开发者的福利,我们只需要调用 api,就可以创建一个智能应用,
在上一篇文章中,我们介绍了《基于 ChatGPT API 的划词翻译浏览器脚本实现》,使用的模型是 text-davinci-003 也就是文本补全模型,今天我们将使用 gpt-3.5-turbo 模型来实现一个场景化的智能应用。


OPEN AI API 介绍


自动完成 API


POST https://api.openai.com/v1/completions


以下是自动完成 API,有了 OPENAI_API_KEY 之后,我们只需要传入 prompt


const OPENAI_API_KEY = "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";

const prompt = `Translate this into Chinese:
hello world`
;
const res = await fetch("https://api.openai.com/v1/completions", {
method: "POST",
headers: {
"Content-Type": "application/json",
authorization: `Bearer ${OPENAI_API_KEY}`,
},
body: JSON.stringify({
model: "text-davinci-003",
prompt,
max_tokens: 1000,
temperature: 0,
}),
});
const response = await res.json();

const result = response.choices[0].text;

对话 API


POST https://api.openai.com/v1/chat/completions


由于自动补全 API 只能传入一个参数 prompt,AI 不能够理解上下文的场景,因此 gpt-3.5+ API 是为了让 AI 能够支持基于一组对话来返回数据。


在 Node.js 中可以使用以下代码来实现。


const OPENAI_API_KEY = "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";

const prompt = [...];
const res = await fetch("https://api.openai.com/v1/chat/completions", {
method: "POST",
headers: {
"Content-Type": "application/json",
authorization: `Bearer ${OPENAI_API_KEY}`,
},
body: JSON.stringify({
model: "gpt-3.5-turbo",
messages,
temperature: 0.7,
top_p: 1,
frequency_penalty: 0,
presence_penalty: 0,
max_tokens: 500
}),
});
const response = await res.json();

const result = response.choices[0].message

以下是官网给出 messages 例子


const messages=[
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "Who won the world series in 2020?"},
{"role": "assistant", "content": "The Los Angeles Dodgers won the World Series in 2020."},
{"role": "user", "content": "Where was it played?"}
]


  • 每一个 message 由 rolecontent 组成。

  • role 只能是 3 个值, systemuserassistant

  • systemassistant 是可选的,user 是必须的。


官方提供了 playground 帮助我们创建 messages 信息。


openai playground


assistant 也就是其中一次返回的数据信息。
发送的 messages 如下:


const messages=[
{
"role": "system",
"content": "你是一名精通 typescript 的前端工程师,不需要解释"
},
{
"role": "user",
"content": "Convert the following JSON to typescript interface without explanation\n\n{\n \"name\": \"Allen\",\n \"age\": 18\n}"
}
]

比如使用上面的 messages 信息,我们就可以根据它,来创建一个 Tailwind css 代码生成器。


openai playground 拷贝 fetch


通过右键可以直接拷贝为 Node.js fetch 代码。


再来实现一个 JSON 转 Typescript 的例子


openai playground JSON 转 Typescript


那么我们通过以上截图的 messages,就可以创建一个 JSON 转 Typescript 生成器。


在 Next.js 使用


接下来,我们就在 Next.js 中创建一个全栈应用。


那为什么选择使用 Next.JS 呢?



  1. 它是一个全栈框架,既可以写接口也可以使用 react 写前端;

  2. 可以很轻松部署到 verel, 让我们可以直接访问 OPENAI 的接口,摆脱网络限制。


这里我选择使用大圣老师的email-helper模板


创建github仓库


点击 GitHub 选择 Use this Template, 创建一个自己的仓库


目录结构


这个项目很简单,在 pages 目录下 api/generate.ts 用于代理请求接口。


index.tsx 也就是我们的主界面,一个按钮,一个请求,没有其他复杂逻辑。


接下来我们就根据它来创建一个智能的Tailwind CSS 代码生成器


1、首先将 messages 改成以上截图中的 message


2、然后将需要生成的变量存到 state 中,我们就可以实现如下界面


Tailwind CSS 代码生成器界面


点击生成代码就可以 让 ai 帮我们写代码了。


这个界面,有些单调,可以在这个页面上列一些常用的组件,那么也可以直接使用 chatGPT 来生成。


chatGPT 生成组件


将 GPT 回答直接转换成 JSON 数据


chatGPT 转 JSON 数据


将数据渲染到页面中,就可以生成快捷标签了


实现效果


接下来,再将 Tailwind css 的颜色,作为我们的变量,同样使用 GPT 来生成数据


生成 Tailwind 颜色


用同样的方式,转化成 JSON,拷贝到我们的代码中。


Tailwind CSS 代码生成器效果


最后一步,我们需要实现一个预览效果,这样的话,就可以所见即所得,根据效果,直接拷贝想要的代码。



小结


本文介绍了 openai 的 api 使用方法,以及如何使用 openai 的 playground 生成需要的 messages 信息。并且通过一个 Next.js 实战例子,结合 ChatGPT 开发了一个 Tailwind CSS 代码生成器。


最后


贴一下文本的代码仓库和预览地址


代码仓库:github.com/maqi1520/op…


预览地址:openai.maqib.cn/


如果对你有帮助,记得给个三连,感谢你的阅读。





作者:狂奔滴小马
来源:juejin.cn/post/7217820487203192892
收起阅读 »

程序员“摸鱼”神器,GitHub Copilot“凭本事”完全免费!!

上周Microsoft 365 Copilot的发布会上几段演示视频让朋友圈沸腾了一整天,颠覆,失业,工业革命刷屏,普遍的焦虑中有工作中重度依赖office的朋友表示如果功能都是真的,那么确实可以节约出很多时间摸鱼,但是立马就有人提醒他或许老板觉得可以节约掉一...
继续阅读 »

上周Microsoft 365 Copilot的发布会上几段演示视频让朋友圈沸腾了一整天,颠覆,失业,工业革命刷屏,普遍的焦虑中有工作中重度依赖office的朋友表示如果功能都是真的,那么确实可以节约出很多时间摸鱼,但是立马就有人提醒他或许老板觉得可以节约掉一半的人省下成本换跑车。


各类信息流中也夹杂着对文心一言的冷嘲热讽,熊熊烈火,车水马龙的梗证实了文心一言确实支持多模态,对中文也有更深的理解...但是不多(纯调侃,本人看好文心的未来)。


图片


图片


我也看了微软发布会的录播和文心一言发布会的直播,发布会上二者的演示内容的形式都是播放视频(为什么只有百度因为这点被骂)。从产品的一系列命名可以看出,微软还是希望以人为中心产出内容,AI只是一个副机长,协助主角更高效地产出,从而让机长把时间留给更有价值,更需要脑力的事情上。 李彦宏在发布的全过程中其实也没有自吹自擂,甚至反复承认目前的效果一般,内部体验的过程中还有不少瑕疵,同时也花了很多口舌强调文心一言 【未来】在中文场景中表现会好于ChatGPT。


对比下来,同样的PPT发布,二者都宣称自己不是简单的GPT套壳,而是结合了自身的优势,借力GPT深度整合以及增强了自家产品。


我看到Copilot这个词,还是下意识地先想起了一些跟程序员有关的事情。


其实早在2021年6月份的时候,GitHub(已被微软收购)就发布了GitHub Copilot,对,也叫Copilot,但是一直没有引起很广泛的关注,原因我猜测有以下几点




  • 程序员圈子的事情,没有出圈




  • 彼时LLM,GPT等概念还没有火,没有获得广泛关注




  • 普遍觉得AI真正在编程这件事上取代人还言之过早




那么站在发布接近2年之后的今天,GitHub Copilot可以做些什么呢?


从功能性的角度出发,其实官网最显眼的位置已经概括得非常准确了


图片


Github Copilot基于openAI预训练的模型,在几十亿行的公开代码的基础上进行了训练,可以将自然语言描述的逻辑转换为代码建议,目前已经支持几十种编程语言。通过这个“助手”,全世界的开发者都可以从样版代码,重复工作等dirtywork中解放出来,把精力聚焦在更重要的事情上——构建伟大的软件!!


GO语言的效果如下:


图片


TS的效果如下:


图片


在用户的主观投票上,可以看出大家比较认可Github Copilot带来的生产力提升,但是有一说一,这个是主观的评价,并无法知道从客观的角度上,老板主观上是不是觉得你提效了(当然你可以只为了自己开心),嘻嘻。


图片


Github Copilot带来的另一个重大的意义——有了这个副机长的帮助,在面对自己不熟悉的语言或者平台编程的时候,你会更有信心。不会在一些低级错误上面拉扯很久,减少在基础的问题上的自信受挫。


在当前主流的IDE或者编辑器上都可以找到插件,目前每一个GitHub的普通用户都可以获得60天的试用期。


图片


具体的使用步骤,这里以VSCode为例:


step1: 在应用商店搜索Github Copilot,点击安装


图片


step2: 安装完成之后,会弹出提示框跳转到Github登录


图片


step3: 登录完成之后,会叫你充钱。😊


图片


60天试用的标题非常醒目!!


最底下还有两行文字说明了可以免费试用的人群,这里我给大家放大看看:


图片


如果是你GitHub上面最流行的那部分开源项目的贡献者的话或者是认证的过的学生(有苹果教育优惠内味儿了!!),可以免费使用Github Copilot。至于“最流行的开源项目”包含哪些?我也没有找到这样的一个名单...不过如果你符合要求的话,点开订阅页面的时候,直接就可以看到免费订阅的操作俺妞。


你看看,我标题是不是没有乱取?!!是不是真有人可以完全免费?!!!(逃)


我很有B数,乖乖准备充钱了。支持信用卡或者贝宝,...反正我最后没充钱成功,有谁成功了留言告诉我哦。😊


图片


如果在VSCode的应用商店中搜索Github Copilot Labs插件的话,你就会发现一款插件的插件,本质上是将一些常用的Prompts封装成了按钮和可视化的操作,比如:


解析代码(帮你看懂一块屎山代码到底做了啥)


图片


实现语言转换


图片


代码刷子功能


可以增强代码可读性,添加类型,智能修复可能的bug,比code Runner更优秀的即时代码调试,优化冗余代码.....


代码刷子在日常编码中应该是非常实用了,可以有效提升代码质量,建议大家充钱试试。


图片


测试用例生成


这个功能可以说是非常非常非常实用了,平时写单元测试其实非常耗时,而且有不少样版代码,这块工作有人代劳的话,真的是可以省出很多时间(摸鱼)!!**

**


图片


你可能会问了,介绍了这么多功能,怎么不点按钮让大伙儿看看效果?!


肯定不是缺钱,而是真的充钱失败了,可能我的visa卡有问题!


好用归好用,如果你既没有免费的资格,又没有充钱,且还安装了插件的话,插件会非常烦人地弹窗提醒你没权限,连不上(催你充钱)!有点讨厌。


图片


图片


最后,不得不提的是这个工具的局限性,ChatGPT(基于3.5)告诉了我以下几点帮大家避雷。


图片


祝福大家充完钱之后立马变强!!


如果没有充钱,也变强了,请留言告诉我!!


如果没有充钱,也没有变强,请留言告诉我!!


如果充钱了,也没有变强,请留言告诉我!!


如果没有充钱,也没有变强,请留言告诉我!!


图片


作者:方始终掘金分终
链接:https://juejin.cn/post/7212561868137070652
来源:稀土掘金
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
收起阅读 »

众人围剿,GPT-5招惹了谁

GPT-4 火爆全球,引发了人工智能大浪潮。过去的一个月,OpenAI、微软、谷歌加上百度不断释放王炸,所有人都相信,AI 的就是未来的生产力。俗话说,人红是非多,树未大已招风,这不,反对 AI 继续前进的声音就来了。 千人呼吁暂停AI训练 3月29日,马斯克...
继续阅读 »



GPT-4 火爆全球,引发了人工智能大浪潮。过去的一个月,OpenAI、微软、谷歌加上百度不断释放王炸,所有人都相信,AI 的就是未来的生产力。俗话说,人红是非多,树未大已招风,这不,反对 AI 继续前进的声音就来了。


千人呼吁暂停AI训练


3月29日,马斯克、苹果联合创始人 Steve Wozniak、Stability AI创始人 Emad Mostaque 等上千名科技大佬和AI专家签署公开信,呼吁暂停训练比 GPT-4 更强大的 AI 系统,为期6个月。


image.png
根据公开信的表示,在这 6 个月内,全社会需要完成这些事:



  • 所有 AI 实验室和独立学者都应该合力开发一套共享安全协议,用于高级 AI 的设计和开发

  • 协议完成后,应该由独立的外部专家进行严格的审计和监督

  • 这些协议必须确保这些 AI 系统毋庸置疑的安全

  • 如果不能迅速暂停,就应该让政府介入。


所有的人工智能研究和开发,都应该重新聚焦于这一点——让当如今最强大的 SOTA 模型更加准确、安全、可解释、透明、稳健、对齐,值得人类信赖,对人类忠诚。


代表人物分析


这次呼吁大佬众多,最具代表性的无疑是马斯克和 Stability AI 创始人 Emad Mostaque。


马斯克是 OpenAI 公司的联合创始人之一,可谓是原始股东,但他在2018年离开了 OpenAI 的董事会。马斯克一直对微软和比尔盖茨持批评意见,对于OpenAI也是如此,此前曾表示“ OpenAI 最初是作为一家开源的非营利性公司而创建的,为了抗衡谷歌,但现在它已经成一家闭源的营利性公司,由微软有效控制……这完全不是我的本意。”


言外之意,OpenAI 不应该成为一个赚钱的公司,应该开源,让所有人看到核心代码和核心算法。如果是这样,应该建议特斯拉免费开源所有自动驾驶技术源码,马斯克对这个问题的回复是“如果其他汽车制造商想要获得授权并在他们的汽车上使用特斯拉的自动驾驶技术,这将是非常酷的一件事情,但是考虑到该系统开发成本极高,特斯拉将会收取一定的费用。”


划重点就是自动驾驶技术成本高,所以要收费。ChatGPT 的训练成本高,惨遭无视。


另一位代表人物 Emad Mostaque 是 AIGC 独角兽企业 Stability AI 的创始人,号称“要让10亿人用上开源大模型”。Stability AI 最牛的项目是人工智能文本转图像模型 Stable Diffusion ,如今,这个项目深陷侵权旋涡。在今年一月份,全球知名图片提供商华盖创意(Getty Images)和艺术家萨拉·安德森(Sarah Andersen), 凯利·麦克南(Kelly McKernan)和卡拉·奥尔蒂斯(Karla Ortiz)起诉了Stability AI,认为Stability AI在未经许可或考虑的情况下,使用他人的知识产权,为自己的经济利益服务。


下面这幅图中,左边是知名油画家Erin Hanson的作品 "Crystalline Maples",右边是CNN记者通过 Stable Diffusion 生成的结果。


image.png


以我们受过九年义务教育的眼光来看,这两幅图风格、色彩,线条几乎一样,说是出自同一人之手也不为过。


在自己公司严重侵犯他人知识产权的情况下,去说另一家公司影响了人类安全和社会稳定,不过是五十步笑百步了。


反对原因分析


信息安全


信息安全是过去三个月最容易攻击ChatGPT的理由,联名信提出了一条质询,我们是否应该让机器用宣传和谎言充斥我们的信息渠道?综合起来的观点是,不良行为者可能会故意创建带有事实错误的内容,作为战略影响力活动的一部分,传播错误信息、虚假信息和彻头彻尾的谎言,这可能会对社会和个人造成危害。将这个观点强加于ChatGPT上,是避重就轻之举。


虚假信息,有什么比搜索引擎更多吗?虚假广告,违禁视频,歧视言论等数不胜数,上当受骗的人同样数不胜数。相较而言,ChatGPT的表现已经非常遵守道德和法律了。


错误信息,对于企业而言,文本信息会经过员工的二次编辑和确认,才会发布;错误的代码会经过程序员的修改和验证,才会用于产品中。只要责任制明确,风险是可控的。


人身安全


这次事件,被大家提起最多一条理由就是比GPT-4更先进AI系统将威胁人类安全,AI将杀死人类。若说威胁安全,智能驾驶和机器人更具有天然不安全属性。GPT-5终究是活在互联网世界中,任他搅的天翻地覆,也不会直接对人类进行物理攻击。智能驾驶如果失去控制,将导致车毁人亡,交通瘫痪。未来给机器人装上武器,就是最强特种兵。


不可否认的是,AI未来确实存在风险,但我们不能饮鸩止渴,因为未来的风险而停止新技术的前进。人工智能炒作了这么多年,直到ChatGPT才真正点燃了火炬,我们不应该在刚刚见到光明时,就亲手熄灭了它,技术推进和安全协议制定完全可以同步进行。


失业


根据高盛研究报告,全球预计将有3亿个工作岗位被生成式AI取代。目前欧美约有三分之二的工作岗位都在某种程度上受到AI自动化趋势的影响,而多达四分之一的当前岗位有可能最终被完全取代。该研究计算出美国63%的工作暴露在“AI影响范围”中,其中7%的工作有一半以上的流程可以由AI自动化完成,这使他们很容易马上被人工智能取代。


对于国内来说,目前感觉还好,可能主要在图像创作领域感受到寒意比较强,上周看到有博主表示,公司一次性裁了三个原画师。


b2f5b5034fac9cc366bff4dcc1815a32.jpeg
当新技术出现时,初期给社会带来的冲击会让很多人感到不适应,因为不适应,所以会本能的去排斥它。比如曾经的克隆,刚出现时引起了大家恐慌,认为会制造另一个自己,同时带来繁衍上的伦理问题。再比如前几年新能源起步时,大家纷纷嘲讽新能源车,认为它是来收智商税的,时至今日,新能源车已经是大势所趋。


现在的失业主要是国际经济形势带来的,而不是刚刚发展的AI系统带来的。ChatGPT只是一个工具,若说替代,机器人替换下来的劳动人口更多,但没有千名大佬站出来说要暂停机器人技术的发展。


利益


世上没有无缘无故的爱,也没有无缘无故的恨,天下熙熙,皆为利来,天下攘攘,皆为利往,所谓者,都是为了自身利益。呼吁暂停训练比 GPT-4 更强大的 AI 系统,目前只有OpenAI有能力训练比GPT-4更强大的系统GPT-5。根据预测,作为过渡的 GPT-4.5 模型将在 2023 年 9 月或 10 月推出,刚好就是联名信提出的暂停6个月。因此,所谓的的暂停,完全就是针对OpenAI的GPT-5。


OpenAI和微软在三月份的一系列进展让其他的公司产生了深深的危机感,这次的专家有的是自己拥有AI公司,有的是自己在AI领域深耕多年,通常来说,大多数人已经成为了利益团体的代言人。既生瑜何生亮,我没有的你也不能有,我有了,但你一枝独秀,那就枪打出头鸟。只有减缓OpenAI的发展速度,才能给自己追赶的机会。


正如前谷歌大脑成员吴恩达所说,我们该做的,应该是在AI创造的巨大价值与现实风险之间,取得一个平衡。把“让AI取得超越GPT-4的进展”暂停6个月,这个想法很糟糕。


总结


AI不是洪水猛兽,暂停GPT-5训练的做法解决不了安全问题,只有技术演进和安全协议制定同步进行,才能实现科技繁荣。6个月后的GPT-4.5依然只是一个工具,不存在威胁人类安全的可能,之后需要更多训练时间的GPT-5同样只是一个工具,这段时间,足够制定联名信期望的安全协议了。


所以,当务之急不是暂停训练比 GPT-4 更强大的 AI 系统,而是立即推动安全协议条款的研究。


作者:柒号华仔
来源:juejin.cn/post/7216412604800450621
收起阅读 »

8 款AI 绘画生成器:从文本创建 AI 艺术图像

人工智能正在影响各行各业,近年来它对创意产业的影响越来越大。由于AI绘画生成器的可操作性,许多人有机会用自己的想法进行艺术创作——即使他们没有接受过系统的专业艺术教育。 最先进的人工智能绘画生成器可能会改变我们未来创作艺术的方式。使用 AI 绘画生成软件,您可...
继续阅读 »

人工智能正在影响各行各业,近年来它对创意产业的影响越来越大。由于AI绘画生成器的可操作性,许多人有机会用自己的想法进行艺术创作——即使他们没有接受过系统的专业艺术教育。


最先进的人工智能绘画生成器可能会改变我们未来创作艺术的方式。使用 AI 绘画生成软件,您可以生成肖像、风景和抽象艺术。您甚至可以模仿著名艺术家的风格。


简单说,您可以使用在线 AI 绘画生成器。通过使用在线AI图像生成器,输入文本,就可获得根据您描述而来的逼真的样式图像。


市场上出现了一系列AI绘画生成器,可以尝试一下。本文是对市场上推荐的一些流行的AI绘画生成器的全面回顾。请继续阅读。


1. 福托尔(Fotor)


Fotor,一站式多合一在线照片编辑器,最近发布了一个 精湛的AI图像生成器 。你只需要把你的想法输入到生成器中,然后你可以看到它在几秒钟内变成一个图像。Fotor有多种图像样式供您选择,例如随机,3D,动漫等。


Fotor的AI文本到艺术生成器最显着的特点是它非常适合初学者使用,只需填写文本并选择要生成图像的效果即可。如果您对照片不满意,可以多次重复生成,以确保获得最满意的结果。每个帐户每天都有一个积分可供您免费使用高质量的 AI 艺术


主要特点:



  • 每天生成 10 张免费图片。

  • 9种灯光效果供您选择。

  • 9种不同的转换风格供您选择。

  • 文本到图像和图像到图像的转换模式。

  • 6种作品可供选择。


Fotor AI 绘画生成器


2. 达尔-E 2(DALL-E 2)


AI绘画生成器达勒2


公众已知的最受欢迎的AI绘画生成器是 Dall-E-2图像生成器 ,由OpenAI开发的AI图像生成器。只需几分钟,您就可以使用 AI 技术创建高度逼真的图像。该工具可用于创建插图、设计产品和为业务产生新想法。Dall-E-2 是一个易于使用的界面,任何人都可以使用 AI 创建高质量的图像。DALL-E 2 支持向生成的图像添加详细信息或对其进行其他修改。


主要特点:



  • 高度逼真的图像。

  • 创建插图。

  • 设计产品。

  • 可定制的多层图像。

  • 编辑和修饰功能。

  • 免费试用(尽管您必须通过等候名单获得邀请)。


3. 火锅(Hotpot ai)--支持api


火锅AI绘画生成器


火锅 AI 可帮助您创建令人惊叹的图形、图像和文本。它激发创造力并自动化工作,而易于编辑的模板使任何人都可以创建设备模型、社交媒体帖子、营销图像、应用程序图标和其他工作图形。


火锅AI的文本到图像AI绘画生成器使任何人都可以创建有吸引力的绘画,插图和图像。描述你想要什么,并观看火锅将其变为现实。


付费创作在 3-10 秒内完成。免费请求需要 1-15 分钟,具体取决于流量。付费用户可以获得更快的服务器、更好的图像、商业用途,并避免每日限制。该系统为不太富裕的人免费提供补贴。您还可以免费申请积分以减少等待时间。


主要特点:



  • 无需代码即可创建 API/批量。

  • 快速照片生成(付费)。

  • 每日免费照片生成积分可用。


4. 夜间咖啡厅(NightCafe)


爱画生成器夜咖啡厅


夜咖啡馆是著名的人工智能艺术生成器之一。它以比其他 AI 绘画生成器具有更多的算法和选项而闻名,并且新手很容易上手。您需要做的就是前往他们的网站并根据您的想象力输入文本提示。然后,您需要等待最多 30 秒,一件艺术品才会出现在您面前。Nightcafe有自己的一套积分系统,您可以通过参加各种活动来获得积分,然后拥有可以免费生成图像的次数。此外,您还可以购买积分。


主要特点:



  • 信用赚取系统。

  • 视频生成工具。

  • 有用的社交功能。

  • 获得您生成的艺术品的所有权。

  • 比其他生成器更多的算法


5. 深度人工智能(DeepAI)


深度AI绘画生成器


自 2016 年以来,DeepAI 是首批通过开源软件生成人工智能图像的 AI 绘画生成器之一。


DeepAI允许您创建任意数量的图像,并且每个图像都是唯一的。它是高度可定制的,允许您更改细节、颜色、纹理等的数量。如果您输入插图,DeepAI 可以立即生成与分辨率无关的矢量图像。


这是一个免费的在线AI图像生成器,这意味着您无需下载或进行其他设置。DeepAI还有一个API,开发人员可以使用它来连接到另一个软件项目。


主要特点:



  • 始终免费使用。

  • 为每个提示生成四个输出图像。

  • 开源软件。

  • 更改每个图像的各种细节。

  • 使用卡通 GAN 创建卡通


6. 深度梦境生成器(Deep Dream Generator)


深梦生成器


深度梦境生成器 是另一种流行的 AI 绘画生成器,支持在线人工智能来创建逼真的图像。Deep Dream依赖于用数百万张图像训练的神经网络。它易于使用,只需要您上传图像,然后根据原始图像自动生成新图像,您还可以选择不同地方或时期的绘画风格。


该工具允许您选择一个类别,例如动物或风景,然后基于它创建逼真的图像。最重要的是,Deep Dream允许您从三种样式中进行选择。深风格,薄风格或深梦。选择样式后,可以预览图像。


主要特点:



  • 训练神经网络的数百万张图像。

  • 不同的绘画风格。

  • 图像的分类。

  • 文本到图像,图像到图像。


7. 克雷永(Craiyon)


克雷永爱绘画生成器


Craiyon,以前称为DALL-E mini,是一种人工智能模型,可以从任何文本提示中绘制图像。只需输入文本描述,它将根据您输入的文本生成 9 个不同的图像。该模型需要大量计算,因此Craiyon依靠广告和捐赠来支付其服务器的费用。只要您尊重使用条款,您就可以随意使用它们供个人使用,无论您是想与朋友分享还是将它们打印在 T 恤上。
主要特点:



  • 易于使用。

  • 无需注册或注册。

  • 免费生成无限的AI图像。

  • 一次生成 9 张图像,以有趣和创造性的方式


8. 星空人工智能(StarryAI)


星空AI绘画生成器


星空 AI 是一个 AI 绘画生成器,专注于将您的想法转化为 NFT 艺术。与大多数其他AI艺术生成器类似,Starry AI赋予您生成图像的所有权。这意味着您可以在任何地方使用图像,用于个人或商业用途。


Starry AI最好的部分是它是完全免费的。它是最好的免费 AI NFT 艺术生成器之一。它不需要用户的任何输入。它可以使用机器学习算法处理图像。该技术在不断改进,但已经有令人难以置信的使用该应用程序创作的艺术示例。


主要特点:



  • 自动图像生成器。

  • 无需用户输入。

  • 免费的 NFT 生成器。

  • 文本到图像


结论


这是人工智能的时期。使用 AI 图像生成器的强大功能自己创作令人惊叹的艺术品。自动将您的想象力变成绘画。AI图像生成器是未来。


在本文中,我们简要介绍了市场上顶级的AI绘画生成器,并推荐了八种最好的AI绘画生成器供您尝试。希望本指南对您有所帮助,谢谢!





作者:非优秀程序员
来源:juejin.cn/post/7214164344290951205
收起阅读 »

震惊!这个基于GPT-4的代码编辑器让我感到恐慌!

一 首先,我不是标题党。我确确实实受到了震撼。 其次,我今天要写的也不是在chatGPT里面叫AI写什么冒泡排序,鸡兔同笼等网上都已有大量代码示例的问题。 我知道chatGPT已经火出圈了,本人也试验过叫AI写一些简单的程序,太简单的基本上都能写对,稍微复杂点...
继续阅读 »


首先,我不是标题党。我确确实实受到了震撼。


其次,我今天要写的也不是在chatGPT里面叫AI写什么冒泡排序,鸡兔同笼等网上都已有大量代码示例的问题。


我知道chatGPT已经火出圈了,本人也试验过叫AI写一些简单的程序,太简单的基本上都能写对,稍微复杂点的也能介绍个大致思路,代码也能给出,但是很多都无法正常跑起来,也有一些逻辑性的错误。最多也只能用来参考下。


虽然我觉得目前AI能理解一些人类的意图,能给出大致的实现代码,但是还无法代替程序员去写一些稍微复杂点的算法程序。


直到我今天在网上看到这样一款AI写程序的软件:Cursor


官网长这样:


1.png



查了下该软件的特点以及背后的公司,问了new bing:


2.png


好家伙,原来是openAI这个公司出的。


但我又一想,不就是接入了chatGPT的API么,包装成一个IDE的样子。关键是chatGPT的代码功力我领教过,其实问题挺多的,有时候会有很基础的逻辑错误问题,完全不能拿来直接跑。


但是看在是openAI公司出品的份上,我还是下了这个软件,其实我并不报希望。


软件界面长这样,很像一个IDE:


3.png


简单问了一些猜数字,快速排序的问题。全对,直接复制到IDEA里就能直接跑。比如上图就是我问的一个给出猜数字游戏代码的问题。


其实这种程度chatGPT也能做到。但是很明显我的直观感受是cursor给出的代码的速度比chatGPT快太多了,基本是一秒十几行的速度。


我决定上点强度。



我于是不再问一些网上已有大量示例的经典问题,提了一个swing的需求,要求他帮我写一个swing界面,具体描述如下:



用swing写一个秒表程序,请在界面上画一个圆形的红色的秒表图形,图形上有2根针,一根是分针,一根是秒针,分针比秒针要短,初始都指向0分0秒。在秒表下方还有2个按钮,一个是开始,一个是暂停,当点击开始按钮的时候,秒表时钟开始走动,当点击暂停时,秒表停止走动。暂停后再点击开始,会继续走动。



输入进去,然后AI几乎没思考就开始写了:


4.gif


几秒钟就写完了,好像乍看之下还挺像那么回事,因为我看到他定义了颜色,画了线。我复制到IDEA里面一运行,竟然真的可以运行起来,效果如下:


5.gif


这个有点出乎我的意料,整体除了按钮位置有点不对以外,其他功能和我描述完全正确。


接着加大难度,我给他出了一道在swing界面文件对比的题:



请用swing写一个程序,图形界面顶部上有3个按钮,其中2个分别支持上传2个TXT文件,还有一个比较按钮,点击按钮,则会去比较这2个文件中内容的不同之处,如果完全一致,则弹出一个提示框表明2个文件内容一致。如果不一样,则在下方图形界面(和按钮不在同一行)分别显示这2个文件的内容,在文件内容里面用黄色下标箭头在内容不一致的地方打上标记



想解释下,为什么我一直给他出swing的题,因为swing有界面,好验证啊。


依然是秒出代码,大家看动图:


6.gif


程序明显比之前长很多,中间我输入了2次继续。总体挺丝滑的。复制程序到IDEA里面运行:


7.gif


这下彻底震惊到我了,卧槽,核心功能算是全部实现了。但也有瑕疵,我要求的是用黄色箭头把不一样的地方作标记,他则是把不一样的内容用文本的形式列了出来。


GPT-4写程序难道那么厉害了么,只要描述一小段话,就能写出一个小demo程序来。而且还可以直接运行。


我于是把相同的描述贴给了chatGPT,虽然chatGPT也给出了代码,但是运行出来是完全不对的。


这就说明,cursor不仅仅是个套壳软件。它是真正基于代码的方式进行训练的。



除了swing,普通的java多线程并发业务程序能写么,我于是又问了一个常见的业务问题:电商秒杀模拟程序。描述如下:



写一段程序,模拟下以下业务:
举办一个秒杀活动,总共有2个商品,商品A和商品B,各有50件。需要定义出商品的类。用线程模拟1w个人同时进来抢购,1w个人分别用ID1,ID2,ID3,以此类推来表示。
每个人每个商品只能最多抢2件。2个商品均没抢到的顾客信息不用打印,只打印出抢到了商品的顾客信息,格式举例如下:
顾客[ID1]抢到了[商品A]2件,[商品B]1件



我相信我描述的已经挺清楚了,也说明了要进行多线程,顾客ID命名给了一个推论的形式描述,以及打印信息只给了一个范例描述,看看AI能否学样去打印出符合我的结果


操作过程和上面一样,我就不贴动图了。贴一个图片看看:


8.png


运行出来的打印结果为:


9.png


这下我又要卧槽了,结果是100%完全正确的!我又仔细看了AI写多线程并发,发现也是完全正确的。



其实我测试到这里的时候,我心里已经开始焦虑了,没错,目前cursor也只能写一些单一算法的程序,但是正确率和理解力已经让我吃惊了,从chatGPT横空出世到GPT-4这才几个月啊,就已经这么强了。是不是再过几年,我们就要失业了,是不是就再也不需要程序员了?产品经理只要把详细的描述贴给AI,AI半小时吊打一个技术团队一个月的工作量。


细思极恐。


最后我把cursor的官网地址贴一下,大家可以去下载体验:


https://www.cursor.so/

作者:铂赛东🐶
链接:https://juejin.cn/post/7213994652486910007
来源:稀土掘金
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
收起阅读 »

白嫖谷歌搭建个人AI绘画(stable-diffusion),A卡救星

💡 最近的AI绘画大火,满心欢喜的准备体验一下,奈何网上大多数网站都是要收费,想着本地搭建一波,结果发现自己是AMD,但是多数开源的都不支持AMD,幸好在B站找到了大佬白嫖教程,这里就小记一下自己白嫖谷歌计算资源,自己生成AI绘图的教程 前置条件:可以访问谷歌...
继续阅读 »

💡 最近的AI绘画大火,满心欢喜的准备体验一下,奈何网上大多数网站都是要收费,想着本地搭建一波,结果发现自己是AMD,但是多数开源的都不支持AMD,幸好在B站找到了大佬白嫖教程,这里就小记一下自己白嫖谷歌计算资源,自己生成AI绘图的教程


前置条件:可以访问谷歌,有谷歌账号,Github



操作步骤:



1.打开Github项目




  1. 项目地址:github.com/camenduru/s…

  2. 分支选择drive





2.项目安装到谷歌的云端硬盘


2.1 按住ctrl点击一号位置,新窗口打开第一个链接,出现一个新的页面 2.2 第一步:复制到云端硬盘,第二步点击运行,第三步出现这个说明成功,点击期间会出现谷歌的弹窗,直接确定就可以了。 谷歌的云端硬盘,每个用户有15G的免费空间,这个项目大概12G,剩下的空间可以装一写model


3.运行stable-diffusion-webui


3.1 回到Github页面,继续按住ctrl点击二号位置,会打开一个新的连接,和第一次一样,保存-运行 3.2 运行需要一段时间,过一会儿,我们就会看见给出了两个连接,选择最后一个 3.3 打开连接,可以看到AI绘画熟悉的页面,默认是有个model的,不过它生成的图不怎么样,可以去换个model


4.更换model


4.1 model网址:civitai.com/ 4.2 这个复制model链接 4.3 添加model,回到Github页面,继续按住ctrl点击三号位置,将刚才复制的链接放到第一行,第二行是model的名字。复制完后,直接运行,等待就可以了


5.查看model,下载完成后model存放位置




6.生成成果


适合大家随意的玩一玩儿,祝大家玩儿的愉快。


作者:是阿乔呀
链接:https://juejin.cn/post/7213944791172055095
来源:稀土掘金
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
收起阅读 »

屡次wx.getLocation申请被拒,让ChatGPT帮我编写申请理由后立马通过

微信小程序完成某些需求功能需要获取精准经纬度,需要微信小程序后台-开发管理-接口设置,申请“获取当前的地理位置、速度(wx.getLocation)”,一直审核不通过,有的人甚至提交了10多次都没有通过,如果你没有掌握方法,及时申请几个月还是一样不给通过。 包...
继续阅读 »

微信小程序完成某些需求功能需要获取精准经纬度,需要微信小程序后台-开发管理-接口设置,申请“获取当前的地理位置、速度(wx.getLocation)”,一直审核不通过,有的人甚至提交了10多次都没有通过,如果你没有掌握方法,及时申请几个月还是一样不给通过。


包括本人也是申请数次未通过,思考是否是理由不够充分,借助ChatGPT帮助我丰富申请理由,我用ChatGPT的回答来申请,立马审核通过。以下是模拟对ChatGPT的提问和回复。
1679989283893.jpg


提问


这是一个社区团购的微信小程序,由于团购服务点功能,需要精准定位到最近的服务点,因此需要wx.getLocation接口申请。请你基于我的需求,编写一个充分的申请原因,并包含操作步骤说明。


ChatGP回答


申请原因:


该社区团购微信小程序需要使用wx.getLocation接口获取用户的地理位置信息,以便精准定位用户所在地区,并显示最近的服务点。服务点根据用户所在地区的需求,提供更加贴近实际的商品和服务,确保用户的用户体验。该接口可以通过用户授权的方式获得用户所在位置信息,不会泄露用户的隐私信息。


操作步骤:


1. 首先在微信小程序中调用wx.getLocation接口进行定位,用户将会收到授权提示,需同意授权以便应用获取用户的地理位置信息。

2.定位成功后,小程序将通过得到的经纬度信息,计算用户位置与服务点之间的距离,并返回最近的服务点信息给用户。

3. 如果用户不同意授权,将无法获取用户地理位置信息,定位功能将无法使用,导致无法提供精准的服务点查找。

4.在使用wx.getLocation接口时,需要注意用户个人隐私问题,小程序应在提供提醒并遵守相关规定的前提下,妥善保护用户隐私信息。


接口申请总结


ChatGPT的回答固然帮助我们丰富了申请原因,但是申请该接口的基本要点还是要掌握。



  1. 确保小程序的服务类目可申请wx.getLocation,最好是主营类目,包含两个类目。

  2. 原因表达充分,主要以用户体验角度,及用户隐私。

  3. 提交的图片、视频,符合申请的步骤。


最后


ChatGPT是自然语言处理工具,需要充分的表达清楚,才可能接近输出我们需要的答案,且我们能够甄别验证它的输出。


其他
# 经验分享:快速通过“获取当前的地理位置、速度(wx.getLocation)接口”审核


作者:ZTrainWilliams
来源:juejin.cn/post/7215465880884674619
收起阅读 »

让ChatGPT帮我写一篇博客

前言 昨天还是前天在公众号看到美国的一个设计师兼作家的Jackson,在用ChatGPT创业,他让ChatGPT做“老板”,自己充当一个人工联络员,这样的一个故事让他火了,不仅推特粉丝大涨,公司也做得有模有样。这就给我一些启发,今天早上突然想到为什么不能让Ch...
继续阅读 »

前言


昨天还是前天在公众号看到美国的一个设计师兼作家的Jackson,在用ChatGPT创业,他让ChatGPT做“老板”,自己充当一个人工联络员,这样的一个故事让他火了,不仅推特粉丝大涨,公司也做得有模有样。这就给我一些启发,今天早上突然想到为什么不能让ChatGPT也帮我干活呢,所以我让他写了一篇我感兴趣的博客。


什么是交互艺术?



  • 交互艺术的定义和历史


交互艺术(Interactive Art)是指通过观众与作品互动来创造艺术作品的一种艺术形式。观众可以通过各种方式来参与艺术作品的创作过程,例如通过触摸、声音、身体动作、传感器等方式与作品互动,从而影响作品的展示效果和呈现形式。


交互艺术的历史可以追溯到20世纪60年代,当时的科技进步促使艺术家开始尝试使用电子设备和计算机来创建艺术作品。随着计算机技术的不断发展,交互艺术逐渐成为一个独立的艺术领域,许多艺术家开始探索如何将新兴技术与传统艺术形式结合起来,创造出更具互动性、多媒体性和参与性的艺术作品。


在当代艺术中,交互艺术已经成为一个重要的艺术形式,不断涌现出许多富有创意和思想性的作品。交互艺术的发展也受到了数字技术和科技的快速进步的影响,艺术家们可以使用越来越先进的技术来创造更加复杂、多样化的交互艺术作品。



  • 交互艺术与传统艺术形式的区别和相似之处


交互艺术与传统艺术形式在表现形式、创作方式和观赏方式上存在一些区别和相似之处。


区别:



  1. 表现形式不同:传统艺术形式通常是静态的,比如绘画、雕塑等,而交互艺术则常常是动态的,利用科技和互动方式与观众进行互动。

  2. 创作方式不同:传统艺术形式往往是由一个或几个艺术家单独创作完成,而交互艺术则通常需要一个团队来完成,包括设计师、程序员、工程师等多个专业人员。

  3. 观众参与度不同:传统艺术形式通常是观众被动地欣赏,而交互艺术则需要观众的积极参与,观众不再是简单的观看者,而是成为作品的一部分,与作品进行互动。


相似之处:



  1. 创作目的相似:传统艺术和交互艺术都有一个共同的目的,就是通过艺术表达和传递情感、思想和价值观念等。

  2. 创作需要创意:无论是传统艺术还是交互艺术,都需要创意,才能产生具有艺术价值的作品。

  3. 艺术的审美标准类似:无论是传统艺术还是交互艺术,都需要具有一定的审美标准,才能得到观众的认可。


总的来说,交互艺术是一种创新的艺术形式,与传统艺术形式相比具有很多不同的地方,但它们都是为了表达和传递情感、思想和价值观念等而存在的。


交互艺术的表现形式



  • 交互装置


互动装置是一种创新的展示形式,是通过各种技术手段实现人机交互,让观众能够积极参与其中,与艺术品互动,甚至改变艺术品的形态。例如,光线与声音互动的装置、投影与运动互动的装置、使用虚拟现实技术的装置等。



  • 互动性媒体


数字媒体是指以计算机技术为基础,通过数字技术手段,将文本、音频、视频等多种媒体形式进行集成和处理的一种新兴的艺术形式。数字媒体广泛应用于网络、游戏、互动展览、艺术品创作等领域。数字媒体可以通过人机交互来实现观众参与。



  • 跨媒介艺术


跨媒介艺术是指将不同的媒介进行融合,从而创造出全新的艺术形式。在交互艺术中,跨媒介艺术得以大量运用,以实现更为复杂和多样化的表现。主要包括:融合音乐,舞蹈,戏剧,美术,文字等等。


交互艺术的设计过程



  • 设计理念和目标


交互艺术的设计理念和目标可以根据具体项目的不同而有所不同,比如以互动性为主:交互艺术的设计目标是与观众进行互动,让观众成为艺术作品的一部分。互动可以是双向的,也可以是多向的,观众和作品之间可以有各种形式的交流和反馈。以参与性为主:交互艺术作品的设计目的是让观众成为作品的参与者,观众不仅是作品的被动观看者,还可以通过各种方式主动参与到作品中,体验艺术的过程。以创新性为主:交互艺术通常借助科技手段来实现艺术形式的创新,例如虚拟现实、增强现实、人工智能等技术,让观众体验到新颖的艺术形式和感官体验。以实验性为主:交互艺术通常具有实验性质,设计者会尝试各种不同的技术和形式,不断探索和发掘新的艺术表现方式和可能性。以社交性为主:交互艺术作品通常可以带来社交体验,让多个观众之间产生互动和交流,增加观众之间的沟通和共同体验。以可持续性为主:交互艺术的设计也需要考虑作品的可持续性,包括对环境的影响、对观众的健康和安全等方面的考虑。同时还需要考虑作品的维护和管理,确保作品的长期运行和展示。



  • 技术实现和选择


交互艺术的技术实现有多种选择,以下是一些常见的技术实现:



  1. 传感器技术:通过感应器获取观众的运动、声音、触摸等行为,以此来激发或控制艺术作品的变化。

  2. 虚拟现实技术:使用计算机技术和虚拟现实设备(如头戴式显示器、手套式控制器等)创造虚拟空间,使观众可以沉浸在其中与作品进行交互。

  3. 增强现实技术:使用手机、平板电脑等设备,将虚拟图像叠加在现实场景中,使观众可以在真实场景中进行虚拟的交互体验。

  4. 数据可视化技术:使用数据可视化软件和技术将数据转化为图形、动画、声音等形式,让观众可以与数据进行交互并得到更深入的理解。

  5. 互动音乐技术:使用计算机技术和音乐软件,将观众的声音、运动等行为转化为音乐,并与音乐作品进行互动。

  6. 智能机器人技术:使用机器人技术和人工智能技术,创造能够与观众进行交互的智能机器人艺术作品。


除此之外,还有许多其他的技术可以被应用于交互艺术的实现,这取决于艺术家的创造力和技术能力。



  • 用户参与和反馈


用户参与和反馈在交互艺术中起着至关重要的作用,这是因为交互艺术强调观众参与、互动和沟通,与传统艺术形式相比,用户的参与和反馈更能够影响交互艺术的展现和效果。用户参与和反馈可以创造更丰富、更具有互动性的艺术体验。通过参与和反馈,用户可以主动探索和发现艺术作品中的细节,与艺术家进行更深入的互动和交流。用户参与和反馈可以增加用户对交互艺术的参与度,使观众更加融入艺术作品之中,感受到艺术作品所传达的情感和信息。用户反馈可以帮助艺术家改善艺术作品的表现,及时发现并解决问题,让作品更加完善和符合观众的期望。通过参与和反馈,用户可以更好地理解和体验艺术作品,从而对作品产生更深刻的印象和理解,提高作品的艺术价值和影响力。


交互艺术的影响和意义



  • 对艺术和文化的影响


首先,交互艺术提供了新的观看方式和体验方式,通过参与和互动,观众成为了作品的一部分,与作品发生了联系和互动,这种体验方式比传统艺术观看更加身临其境,更能够引起观众的共鸣和情感共鸣。


其次,交互艺术扩展了艺术形式和创作方式的范围,使得艺术家可以使用更多的媒介和技术手段来表现自己的创意和思想,创作出更加复杂、多样化的作品。同时,交互艺术还促进了跨学科的合作和交流,让不同领域的人们汇聚在一起,共同探索艺术的新领域和可能性。


最后,交互艺术也在一定程度上挑战了传统艺术的观念和价值体系,它更加强调观众的参与和互动,追求创意和表达的多样性和自由性,让艺术更加民主化和开放化,更加贴近生活和人们的需求。



  • 对科技和创新的影响


交互艺术与科技、创新密切相关,因为交互艺术往往需要运用先进的科技和技术手段来实现。因此,交互艺术对科技和创新的影响主要表现在以下几个方面:



  1. 推动科技进步和应用:交互艺术在探索人机交互的过程中,往往需要运用先进的科技和技术手段,例如虚拟现实、增强现实、智能算法、传感器技术等等。这些技术的研究和应用,可以推动科技的进步和应用,也可以为其他领域的技术创新提供借鉴和参考。

  2. 催生新兴产业:随着交互艺术的不断发展和普及,一些新兴产业也应运而生,例如虚拟现实、增强现实、智能穿戴等等。这些产业的发展,也为科技和创新提供了新的发展机遇。

  3. 拓展创新思维:交互艺术强调观众参与和互动,鼓励观众从不同的角度去思考和理解作品。这种互动式的艺术形式,不仅可以拓展观众的视野和想象力,也可以激发人们的创新思维,从而为科技和创新带来新的灵感和方向。

  4. 促进科技与文化的融合:交互艺术将科技和文化相结合,探索科技与文化之间的互动和融合。这种融合不仅可以为文化艺术注入新的活力和创新,也可以促进科技和文化之间的相互理解和交流,为科技和创新带来新的思路和方向。



  • 对社会和人类的影响


首先,交互艺术的出现丰富了人们的文化生活,为人们带来了全新的艺术体验。交互艺术将观众从被动的接受者转变为积极的参与者和创造者,让人们更深入地体验艺术,对个人的审美和文化素养的提高有积极的推动作用。


其次,交互艺术对科技和创新的发展也有很大的促进作用。在交互艺术的设计中,常常会运用到各种前沿的科技手段,如人工智能、虚拟现实、增强现实等,这些技术的应用不仅提高了艺术表现的多样性和创新性,也促进了科技的发展和推广。


另外,交互艺术也推动了跨学科的合作与交流。交互艺术的创作需要艺术家、设计师、工程师等多个领域的专业人才进行合作,这种跨学科的合作有助于促进不同领域之间的交流与合作,进一步推动科技和艺术的发展。


最后,交互艺术也对社会产生了深远的影响。交互艺术作为一种探索艺术与科技、人与自然等关系的艺术形式,常常会引起人们对社会和人类的思考和反思。同时,交互艺术还可以作为一种公共艺术形式,为城市文化建设和社区文化发展做出贡献。


一些优秀的交互艺术作品的介绍和分析


《雨林声音之旅》(The Rainforest):这是一个由音乐家、工程师和艺术家合作制作的多媒体艺术作品,旨在通过视听交互体验向人们展示热带雨林生态系统的美丽和脆弱。在这个作品中,观众通过穿戴智能耳机,能够听到热带雨林中各种生物的声音,并随着观众的行动而改变。这个作品既展示了交互艺术对生态保护的关注,也通过技术手段提供了一个沉浸式的交互体验。


《万花筒之舞》(Kaleidoscope Dance):这个作品由艺术家和编程人员合作创作,是一个通过跟随舞者动作变幻图形的互动舞蹈。在这个作品中,观众通过观看跳舞者的身影,看到身影在投影上变幻出不同的几何图形,并随着舞者的动作而变化。这个作品的互动性和美学效果非常出色,展示了交互艺术的创造性和能力。


《未来自然》(Future Natural):这个作品由美国纽约市的艺术家托尼·瑞戈(tony oursler)制作,展示了未来科技与自然环境的融合。这个作品是一个互动装置,观众通过操纵屏幕上的自然元素,比如云、火、风和水,来创造出自己的自然景观。这个作品展示了交互艺术的潜力,让观众在艺术作品中自由探索和创造。


《印象派的视觉音乐》(Visual Music of Impressionism):这是一个通过数字技术还原19世纪法国印象派画家的绘画作品的互动展览。这个展览展示了通过数字技术将视觉艺术与音乐相结合的能力,让观众可以通过触摸屏幕、移动手势和声音互动等方式来探索印象派绘画作品的美学和音乐性。


未来展望:交互艺术的发展和趋势


交互艺术从20世纪末期开始兴起,并在21世纪初逐渐得到了广泛的关注和发展。最初的交互艺术作品主要依赖计算机技术,随着移动设备、传感器、物联网等技术的发展,交互艺术的形式也越来越多样化和复杂化。


近年来,交互艺术已经从传统的展览空间向公共空间和虚拟空间延伸,例如城市中的互动艺术装置和游戏、虚拟现实艺术作品等。同时,交互艺术也更多地关注社会和环境问题,例如气候变化、人类生活和工作的影响等。


未来的趋势将继续突破传统的艺术形式,更多地与科技、社会、文化等领域交叉融合,例如增强现实、人工智能、机器人技术等。同时,交互艺术也将更加强调观众的参与和反馈,更加注重体验和互动的情感性和反思性。


作者:HeteroCat
链接:https://juejin.cn/post/7215084575495929915
来源:稀土掘金
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
收起阅读 »

ChatGPT正在杀死程序员,讲讲我的看法——AI春晚,Boom!

AI春晚,Boom! 这两周,简直是AI春晚,ChatGPT4、ChatGPT Plugin、Microsoft 365 copilot、Github copilotX、MidJourney V5、Adobe Firefly、NVIDIA一堆新产品... 多到...
继续阅读 »

AI春晚,Boom!


这两周,简直是AI春晚,ChatGPT4、ChatGPT Plugin、Microsoft 365 copilot、Github copilotX、MidJourney V5、Adobe Firefly、NVIDIA一堆新产品... 多到数不过来了,几乎是数不过来了,大产品发布的速度可以用小时来计算,小产品更是多如牛毛,github trends、Hacker News差不多半数都被ChatGPT相关霸榜。


可谓科技圈的“大变局”,上一次大家这么激动,还是iPhone诞生。


接下来,我来说说看我的看法和一些个人预测。


我的几点看法




  1. ChatGPT的诞生,将带来新的革命,第一次信息技术革命主要是加速了信息传递,而此次第二次信息技术革命,则是让信息传递进一步加速的同时,让信息有了自生产能力。例如:你给AI一个标题,AI可以根据过往学习经验,联想一个新的故事。又比如:你写了一段新的代码,可以让AI帮你解释,也许未来帮你写文档。AI可以根据少量的信息,进行信息生产,这是替代人类一部分能力的关键点。




  2. 我认为大语言模型的能力并未被全部释放,AI可以做的还有更多,更有创造力,只不过暂时被封印了。未来的前景空间无限,随便上升一点点都是big boom.




  3. 这只是这一种模型而已... 相信AI行业的投入的资金接下来会是爆炸式的增长。其他模型大概率很快在资金加持下,进行多轮验证。指不定再来个别的超级AI。




  4. 自然语言(提示语)编程诞生,这将是最难的一门语言,短期来看,必然是英语,掌握英语的人未来拥有更大的竞争力。但是自然语言有较大的缺陷,就是难以构建复杂结构和海量参数的提示语,而人类的需求往往是精准的,只用自然语言效率比较低。所以我预测,未来会有更加结构化的语言诞生,它将综合人类的自然语言和高级编程语言,成长为新的热门语言。




  5. 毫无疑问,随着内容创作方面的效率急速提升,大多数白领的工作将会受到极大影响,被调整优化。不进步就会被淘汰,但是也意味着会出现新的机会。




  6. AI程序员不仅正在杀死白领,还无情地杀死另外一些程序员,底层如前端程序员和测试工程师将会受到巨大影响,优化。这其实是因为,相当一部分程序员的工作其实更接近于内容创作(cv工程师),而不是严密的逻辑思考和创造,所以更容易被AI取代。不得不说,程序员的差距就像人与狗的差距一样大。




  7. 新的繁荣即将到来?毫无疑问。纺织机夺走了大部分手工纺织者的工作,但是催生了更庞大的市场,例如服装设计,人的需求促使人朝着更加高级的方向发展了。那新的工作机会呢?可能是自然语言(提示语)工程、AI训练师等等。




  8. 恭喜前端程序员,终于不用写大量页面和CSS了,暂时也许可以考虑往全栈卷了?




  9. 如果你是一个简单的内容工作者或者初级程序员,那么赶紧学吧,否则将面临失业。




  10. 如果你是中高级技术工程师,也赶紧学吧,新的机会正在到来。本来吧,互联网遇冷,就业困难,大家都不想学了,学不动了,现在好了,局势逼着你学。




  11. 好消息是,我们有墙,也可能是坏消息。




  12. 可以大概率肯定的是,就业市场应该很快会回暖,现在就等巨头公司找找方向,开启新市场。


作者:宋承亮
链接:https://juejin.cn/post/7214493929566748732
来源:稀土掘金
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
收起阅读 »

用ChatGPT提高开发效率(Andoid)

一、前言 我们问了10个问题,开发的、生活中有疑问的,ChartGPT都给了我们答案。这些答案怎么样,请往下看吧。 ChatGPT-1、写一个车牌号的正则表达式 ChatGPT-2、写一个中国大陆车牌号的正则表达式 ChatGPT-3、用kotlin写一个车...
继续阅读 »

一、前言


我们问了10个问题,开发的、生活中有疑问的,ChartGPT都给了我们答案。这些答案怎么样,请往下看吧。



  • ChatGPT-1、写一个车牌号的正则表达式

  • ChatGPT-2、写一个中国大陆车牌号的正则表达式

  • ChatGPT-3、用kotlin写一个车牌号的校验函数

  • ChatGPT-4、用Kotlin写一个String装换成金额的扩展函数

  • ChatGPT-5、用Kotlin写一个String装换成人民币的扩展函数

  • ChatGPT-6、用Kotlin写一个String转换成人民币的扩展函数

  • ChatGPT-7、用Kotlin写一个将TextView的文本内容复制到粘贴板的扩展函数

  • ChatGPT-8、美食探店怎么做?

  • ChatGPT-9、台湾卤肉饭?

  • ChatGPT-10、牛皮弃面馆(柏庐南路店)


二、ChatGPT使用初体验


ChatGPT-1、写一个车牌号的正则表达式
企业微信截图_16796251027919.png


ChatGPT-2、写一个中国大陆车牌号的正则表达式
企业微信截图_1679625500776.png
^[京津沪渝冀豫云辽黑湘皖鲁新苏浙赣鄂桂甘晋蒙陕吉闽贵粤青藏川宁琼][A-HJ-NP-Z](?!DD)[A-HJ-NP-Z0-9]{4}[A-HJ-NP-Z0-9挂学警港澳]$


ChatGPT-3、用kotlin写一个车牌号的校验函数
企业微信截图_16796251209911.png


三、ChatGPT PK 5年+年程序员


ChatGPT-4、用Kotlin写一个String装换成金额的扩展函数
企业微信截图_16796251209911.png


ChatGPT-5、用Kotlin写一个String装换成人民币的扩展函数
企业微信截图_16796251209911.png


ChatGPT-6、用Kotlin写一个String转换成人民币的扩展函数
1111.png
PK
image2023-3-24_11-2-10.png


ChatGPT-7、用Kotlin写一个将TextView的文本内容复制到粘贴板的扩展函数
image2023-3-24_11-2-10.png
PK
image2023-3-24_11-3-0.png


四、总结


ChatGPT-1、写一个车牌号的正则表达式

ChatGPT-2、写一个中国大陆车牌号的正则表达式

ChatGPT-3、用kotlin写一个车牌号的校验函数


以上问题,明确的告诉了我们答案,并且配上了讲解和使用方法。


极大的减少了我们自己写正则的错误概率,或者网上查,答案质量参差不齐的筛选验证的烦恼。


对这种重复劳动、通用的功能函数,ChatGPT很好用


ChatGPT-4、用Kotlin写一个String装换成金额的扩展函数

ChatGPT-5、用Kotlin写一个String装换成人民币的扩展函数

ChatGPT-6、用Kotlin写一个String转换成人民币的扩展函数

ChatGPT-7、用Kotlin写一个将TextView的文本内容复制到粘贴板的扩展函数


以上问题,实现了在开发过程中实际的问题,直接Copy就可以使用


请注意我的问题,用Kotlin写一个String转换成人民币的扩展函数,只要你问题问的明确,ChatGPT就会给你想要的答案


ChatGPT-4、ChatGPT-5转换写错了,写成了装换,ChatGPT理解了我的意思,并且他自我纠正了


ChatGPT-6、ChatGPT-7,ChatGPT与5年+程序员的PK,功能都实现了,实现思路基本相同。但是5+程序员写的更简洁,自由 (程序员的个人素质了,Lewis对个人要求标准较高,这就是通往大佬的之路)。


你在通往IT大佬的路上,不要轻视ChatGPT哦,我们使用的ChatGPT是通用版,训练出来的模型是面向所有用户的。


一个假设,如果使用Githut上所有的代码训练ChatGPT,训练出来的模型还会比不过5年的程序员吗?Githut+ChatGPT好像都为微软的,这个假设可能已经在实验室阶段了。


以上假设已经有了,GitHub Copilot X GitHub + GPT-4联手的产品


五、ChatGPT最后的胡说八道


ChatGPT-8、美食探店怎么做?
企业微信截图_16796255651978.png


ChatGPT-9、台湾卤肉饭?
企业微信截图_16796256304717.png


ChatGPT-10、牛皮弃面馆(柏庐南路店)
企业微信截图_1679625678718.png


ChatGPT-8、美食探店怎么做?

ChatGPT-9、台湾卤肉饭?

ChatGPT-10、牛皮弃面馆(柏庐南路店)


以上问题,初一看ChatGPT回答的很专业,以下详细说一下


ChatGPT-8、ChatGPT-9,很多人都有疑问的问题,网上资料很多,回答的很专业,也很有条理,挺好。作为一个技术就不都说了,可以看看这个「打不过,就加入」,我和ChatGPT的故事


ChatGPT-10,昆山一家小店,没有名气,主打台湾牛肉面和台湾小吃,ChatGPT就开始胡说八道了,但是显得很专业,他谈的模板就是按照逻辑去介绍一家店。如果你问他一家有名的店或者连锁店(例如:海底捞),他会回答的应该很专业。


其实还有很多疑问的,移动开发未来前景怎么样?ETH今天会不会大跌,短线做空可以吗?,但是毕竟今天周五了,让自己过一个愉快的周末吧^_^。


作者:佳应科技
链接:https://juejin.cn/post/7215020908238209083
来源:稀土掘金
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
收起阅读 »

里程碑!ChatGPT插件影响几何?

上周三OpenAI推出了GPT-4,引起了全球轰动,仅仅过去一周多时间,OpenAI又宣布推出插件功能。如果说ChatGPT是AI的“iPhone时刻”,那么插件就是ChatGPT的“App Store”。超强的开发迭代能力,层出不穷的王炸级新产品,让我们不得...
继续阅读 »

上周三OpenAI推出了GPT-4,引起了全球轰动,仅仅过去一周多时间,OpenAI又宣布推出插件功能。如果说ChatGPT是AI的“iPhone时刻”,那么插件就是ChatGPT的“App Store”。超强的开发迭代能力,层出不穷的王炸级新产品,让我们不得不对OpenAI由衷赞叹。


插件发布


3月24日,OpenAI宣布ChatGPT能够支持第三方插件接入,同时为ChatGPT发布了多个插件,它们将帮助ChatGPT联网实时检索信息、运行计算或使用第三方服务。目前装上插件后,用户可以用 ChatGPT 执行以下操作:




  • 检索实时信息:例如体育比赛比分、股价、最新消息等;




  • 检索知识库信息:例如公司文件、个人笔记等;




  • 代表用户执行操作:例如,订机票、订餐等。




由此可以看出,ChatGPT不再是一个单一的知识问答机器人,它将完全走进我们的日常工作和生活,成为全天候平台生态系统。


image.png


根据OpenAI官方发布信息,ChatGPT的第一批第三方插件包含Expedia、FiscalNote、Instacart、KAYAK、Klarna、Milo、OpenTable、Shopify、Slack、Speak、Wolfram、Zapier等11种。例如Open Table插件允许用户搜索可预订的餐厅,Wolfram插件能够提高计算能力,Instacart插件允许ChatGPT在本地商店购物,Zapier可与谷歌Gmail等应用程序连接,适用于办公场景。除了第三方插件,OpenAI同时推出了自己的两款插件——网络浏览器(web browser)和代码解释器(code interpreter)。


网络浏览器


网络浏览器(web browser)是此次最受大家关注的插件,该插件使用微软必应搜索API从网络上检索内容,同时显示它在概括答案时所访问的网站,并在ChatGPT的回应中引用其来源。此前的ChatGPT包括GTP-4训练数据库的信息内容仅限于2021年9月之前的数据,现在通过该插件ChatGPT可以获得网络上最新的数据,极大提高问题回答的时效性。


例如下面的问题中,ChatGPT可以给出2023年的奥斯卡颁奖名单。


image.png


ChatGPT以往是被动接收数据进行推理,开发人员给它投喂大量历史数据,基于这些数据进行推理,从而给出答案。因此,ChatGPT能够获得巨大成功的原因是其出色的推理能力,人总是处于学习知识的过程,要求的是知识回答准确度,对于新鲜度反而要求不高,出色的推理能力有效保证了知识回答的准确性和条理性。相信掘友们没少让ChatGPT写诗,写小说,写代码,这些出色创作并不需要从网络上去获取最新的内容。


但随着大家对ChatGPT的越来越熟悉,使用需求也越来越多,从知识问答扩展到日常生活、工作和出行,个人事务、财务和交际,这就需要当前最新的回答,需要ChatGPT从最新网络数据去检索、分析和推理,也就是从被动接收数据变为主动获取数据,ChatGPT具备了眼睛和耳朵,能够去听去看,去与当前的网络世界进行同步。


代码解释器


代码解释器则能够执行数学问题、数据分析、可视化和文件格式转换等任务,使ChatGPT能够使用Python并在沙盒环境中处理上传和下载任务。简单来说,代码解释器能够为你复杂的问题直接提供代码,省去你大部分的编码工作,也能够阅读代码,修改代码bug。


根据官方的例子,当问到:一块砖的重量是这块砖自身 30% 的重量与 5 个 GPU 的重量之和,已知每吨重量包含了 100 块砖和 200 个 GPU,那么一块砖的重量是多少?


image.png


经过代码解释器后,给出了代码和答案


image.png


这里我们可以看到,回答问题不再简单的文字描述,而是升级到源码描述,说实话惊叹之余感觉到了一丝丝的危机感,假以时日,随着ChatGPT能力不断提升,如果能够完成系统级编程,程序员门槛会不断降低,对于大多数程序员都将形成冲击。


平台生态


通过上面对这次插件的分析可以看到,ChatGPT不再满足于单纯作为一个聊天机器人,插件功能就是ChatGPT的应用商店。在3月34日之前,我们认为的合作关系是ChatGPT接入到其他APP,为其他APP赋能,属于从属低位。在3月34日之后,我们发现所有APP将纳入ChatGPT,形成ChatGPT生态系统,ChatGPT去指挥其他APP工作,属于主导地位。


ChatGPT试图通过插件功能建立生态系统。在这个生态系统中,开发人员可以创建并发布他们自己的插件,借助ChatGPT获取用户和收益。目前手机厂商的应用商店也是这样,第三方应用经过应用商店安装,消费者发生购买行为后,应用商店可以进行抽成获取利润。三个月前,我们担心ChatGPT训练成本非常高,但没有良好的商业化模式,发展困难。现在插件功能出来后,没有一个人会再去担心ChatGPT商业能力,反而是担心自己能不能搭上人工智能的快车,自己会不会被时代所淘汰。


微软魄力


说完OpenAI的重大突破,回过头来,不得不佩服微软的魄力和决心。在必应接入GTP后,必应搜索引擎的访问量增长15%,谷歌降低了1%,一片形势大好,接入GTP的产品就是New Bing,因此这次插件功能的发布最尴尬的反而是New Bing。拥有插件功能的ChatGPT明显比搜索引擎属性加身的New Bing更有发展前景,对于市场前景来说,New Bing基本等同于完整版的必应,微软推陈出新,斩人先斩己。


这与腾讯有点相似,在QQ还是即时通信老大的情况下,坚决推出了微信,时至今日,微信建立起的生态帝国让腾讯无往不利。如果说插件功能即将构建的生态系统,未来将匹敌甚至超过App Store和谷歌搜索的商业价值,已经不会让人觉得是异想天开了。


总结


从GTP3.5到GTP4,从微软Office Copilot到ChatGPT插件,AI技术的演进和应用正以超乎想象的速度袭来,在过去的这几个月,尤其这两周,我们听惯了重磅、史诗、王炸等词,面对日新月异的技术发展,对于个人来说,我们需要选择拥抱新的领域,新的技术,通过了解来调整自己的工作方式和学习目标;对于企业来说,需要熟悉AI技术的现状和未来预期,积极评估面临的冲击和机遇。


作者:柒号华仔
来源:juejin.cn/post/7214489453399474232
收起阅读 »

用ChatGPT提高开发效率(Andoid)

一、前言 我们问了10个问题,开发的、生活中有疑问的,ChartGPT都给了我们答案。这些答案怎么样,请往下看吧。 ChatGPT-1、写一个车牌号的正则表达式 ChatGPT-2、写一个中国大陆车牌号的正则表达式 ChatGPT-3、用kotlin写一个车...
继续阅读 »

一、前言


我们问了10个问题,开发的、生活中有疑问的,ChartGPT都给了我们答案。这些答案怎么样,请往下看吧。



  • ChatGPT-1、写一个车牌号的正则表达式

  • ChatGPT-2、写一个中国大陆车牌号的正则表达式

  • ChatGPT-3、用kotlin写一个车牌号的校验函数

  • ChatGPT-4、用Kotlin写一个String装换成金额的扩展函数

  • ChatGPT-5、用Kotlin写一个String装换成人民币的扩展函数

  • ChatGPT-6、用Kotlin写一个String转换成人民币的扩展函数

  • ChatGPT-7、用Kotlin写一个将TextView的文本内容复制到粘贴板的扩展函数

  • ChatGPT-8、美食探店怎么做?

  • ChatGPT-9、台湾卤肉饭?

  • ChatGPT-10、牛皮弃面馆(柏庐南路店)


二、ChatGPT使用初体验


ChatGPT-1、写一个车牌号的正则表达式
企业微信截图_16796251027919.png


ChatGPT-2、写一个中国大陆车牌号的正则表达式
企业微信截图_1679625500776.png
^[京津沪渝冀豫云辽黑湘皖鲁新苏浙赣鄂桂甘晋蒙陕吉闽贵粤青藏川宁琼][A-HJ-NP-Z](?!DD)[A-HJ-NP-Z0-9]{4}[A-HJ-NP-Z0-9挂学警港澳]$


ChatGPT-3、用kotlin写一个车牌号的校验函数
企业微信截图_16796251209911.png


三、ChatGPT PK 5年+年程序员


ChatGPT-4、用Kotlin写一个String装换成金额的扩展函数
企业微信截图_16796251209911.png


ChatGPT-5、用Kotlin写一个String装换成人民币的扩展函数
企业微信截图_16796251209911.png


ChatGPT-6、用Kotlin写一个String转换成人民币的扩展函数
1111.png
PK
image2023-3-24_11-2-10.png


ChatGPT-7、用Kotlin写一个将TextView的文本内容复制到粘贴板的扩展函数
image2023-3-24_11-2-10.png
PK
image2023-3-24_11-3-0.png


四、总结


ChatGPT-1、写一个车牌号的正则表达式

ChatGPT-2、写一个中国大陆车牌号的正则表达式

ChatGPT-3、用kotlin写一个车牌号的校验函数


以上问题,明确的告诉了我们答案,并且配上了讲解和使用方法。


极大的减少了我们自己写正则的错误概率,或者网上查,答案质量参差不齐的筛选验证的烦恼。


对这种重复劳动、通用的功能函数,ChatGPT很好用


ChatGPT-4、用Kotlin写一个String装换成金额的扩展函数

ChatGPT-5、用Kotlin写一个String装换成人民币的扩展函数

ChatGPT-6、用Kotlin写一个String转换成人民币的扩展函数

ChatGPT-7、用Kotlin写一个将TextView的文本内容复制到粘贴板的扩展函数


以上问题,实现了在开发过程中实际的问题,直接Copy就可以使用


请注意我的问题,用Kotlin写一个String转换成人民币的扩展函数,只要你问题问的明确,ChatGPT就会给你想要的答案


ChatGPT-4、ChatGPT-5转换写错了,写成了装换,ChatGPT理解了我的意思,并且他自我纠正了


ChatGPT-6、ChatGPT-7,ChatGPT与5年+程序员的PK,功能都实现了,实现思路基本相同。但是5+程序员写的更简洁,自由 (程序员的个人素质了,Lewis对个人要求标准较高,这就是通往大佬的之路)。


你在通往IT大佬的路上,不要轻视ChatGPT哦,我们使用的ChatGPT是通用版,训练出来的模型是面向所有用户的。


一个假设,如果使用Githut上所有的代码训练ChatGPT,训练出来的模型还会比不过5年的程序员吗?Githut+ChatGPT好像都为微软的,这个假设可能已经在实验室阶段了。


以上假设已经有了,GitHub Copilot X GitHub + GPT-4联手的产品


五、ChatGPT最后的胡说八道


ChatGPT-8、美食探店怎么做?
企业微信截图_16796255651978.png


ChatGPT-9、台湾卤肉饭?
企业微信截图_16796256304717.png


ChatGPT-10、牛皮弃面馆(柏庐南路店)
企业微信截图_1679625678718.png


ChatGPT-8、美食探店怎么做?

ChatGPT-9、台湾卤肉饭?

ChatGPT-10、牛皮弃面馆(柏庐南路店)


以上问题,初一看ChatGPT回答的很专业,以下详细说一下


ChatGPT-8、ChatGPT-9,很多人都有疑问的问题,网上资料很多,回答的很专业,也很有条理,挺好。作为一个技术就不都说了,可以看看这个「打不过,就加入」,我和ChatGPT的故事


ChatGPT-10,昆山一家小店,没有名气,主打台湾牛肉面和台湾小吃,ChatGPT就开始胡说八道了,但是显得很专业,他谈的模板就是按照逻辑去介绍一家店。如果你问他一家有名的店或者连锁店(例如:海底捞),他会回答的应该很专业。


其实还有很多疑问的,移动开发未来前景怎么样?ETH今天会不会大跌,短线做空可以吗?,但是毕竟今天周五了,让自己过一个愉快的周末吧^_^。


六、延伸阅读


mp.weixin.qq.com/s/PyH2SzFQ9…


juejin.cn/post/721177…


juejin.cn/post/719767…


mp.weixin.qq.com/s/prXyAUf_8…


mp.weixin.qq.com/s/Y1LUxcInd…


mp.weixin.qq.com/s/a3xZZLRgD…


作者:佳应科技
来源:juejin.cn/post/7215020908238209083
收起阅读 »

扒了一千多条关于文心一言的评论,我发现这届网友真的不好糊弄…

前两天,百度紧随GPT-4发布了自己的语言模型文心一言。 讲道理,对于国内能够发布这样一个敢于对标CHAT GPT的高质量语言模型,大家应该更多感受到的是赛博朋克与现实生活贴近的真实感,对这个模型应该有着更多的鼓励或赞美。 可不知是因为整个发布会搞的过于像没有...
继续阅读 »

前两天,百度紧随GPT-4发布了自己的语言模型文心一言。


讲道理,对于国内能够发布这样一个敢于对标CHAT GPT的高质量语言模型,大家应该更多感受到的是赛博朋克与现实生活贴近的真实感,对这个模型应该有着更多的鼓励或赞美。


可不知是因为整个发布会搞的过于像没有好好准备的学生毕业答辩PPT,还是它的实际表现并没有那么如人意,大家貌似对文心一言并不那么买账。


于是我决定看一下知乎大神们对文心一言的评价,哪想到随便打开一个问题,居然有600多条回答…



要是我这一条一条翻完所有回答, 估计就得拿出一天来全职摸鱼了 ,那么有没有什么办法能够最快的分析出对待这个问题大家的综合评价呢?


那么今天就让我纱布擦屁股,给大家露一小手,写一个爬虫扒下来所有的回答,再对结果进行一下分析。


WebMagic


正式开始前,咱们得先搞定工具。虽然python写起爬虫来有天然的框架优势,不过鉴于大家都是搞java的,那么我们今天就用java框架来实现一个爬虫。


咱们要使用的工具 WebMagic,就是一款简单灵活的java爬虫框架,总体架构由下面这几部分构成:




  • Downloader:负责从互联网上下载页面,以便后续处理。WebMagic默认使用了Apache HttpClient作为下载工具。

  • PageProcessor:负责解析页面,抽取有用信息,以及发现新的链接。WebMagic使用Jsoup作为HTML解析工具,并基于其开发了解析XPath的工具Xsoup。

  • Scheduler:负责管理待抓取的URL,以及一些去重的工作。WebMagic默认提供了JDK的内存队列来管理URL,并用集合来进行去重。也支持使用Redis进行分布式管理。

  • Pipeline:负责抽取结果的处理,包括计算、持久化到文件、数据库等。WebMagic默认提供了输出到控制台和保存到文件两种结果处理方案。


在4个主要组件中,除了PageProcessor之外,其他3个组件基本都可以复用。而我们实际爬虫中的重点,就是要针对不同网页进行页面元素的分析,进而定制化地开发不同的PageProcessor


下面我们开始准备实战,先引入webmagiccoreextension两个依赖,最新0.8.0版本搞里头:


<dependency>
<groupId>us.codecraftgroupId>
<artifactId>webmagic-coreartifactId>
<version>0.8.0version>
dependency>
<dependency>
<groupId>us.codecraftgroupId>
<artifactId>webmagic-extensionartifactId>
<version>0.8.0version>
dependency>

PageProcessor 与 xpath


在正式开始抓取页面前,我们先看看知乎上一个问题的页面是怎么构成的,还是以上面图中那个问题为例,原问题的地址在这里:



如何看待百度发布的文心一言?



我们先做个简单的测试,来获取这个问题的标题,以及对这个问题的描述


通过浏览器的审查元素,可以看到标题是一个h1的标题元素,并且它的class属性是QuestionHeader-title,而问题的描述部分在一个div中,它的class中包含了QuestionRichText



简单分析完了,按照前面说的,我们要对这个页面定制一个PageProcessor组件抽取信息,直接上代码。


新建一个类实现PageProcessor接口,并实现接口中的process()这个方法即可。


public class WenxinProcessor implements PageProcessor {
private Site site = Site.me()
.setRetryTimes(3).setSleepTime(1000);

@Override
public void process(Page page) {
String title = page.getHtml()
.xpath("//h1[@class='QuestionHeader-title']/text()").toString();
String question= page.getHtml()
.xpath("//div[@class='QuestionRichText']//tidyText()").toString();

System.out.println(title);
System.out.println(question);
}

public Site getSite() {
return site;
}

public static void main(String[] args) {
Spider.create(new WenxinProcessor())
.addUrl("https://www.zhihu.com/question/589929380")
.thread(2)
.run();
}
}

查看运行结果:



可以看到,在代码中通过xpath()这样一个方法,成功拿到了我们要取的两个元素。其实说白了,这个xpath也不是爬虫框架中才有的新玩意,而是一种XML路径语言(XML Path Language),是一种用来确定XML文档中某部分位置的语言。它基于XML的树状结构,提供在数据结构树中找寻节点的能力。


常用的路径表达式包括:


表达式描述
nodename选取此节点的所有子节点。
/从根节点选取。
//从匹配选择的当前节点选择文档中的节点,而不考虑它们的位置。
.选取当前节点。
..选取当前节点的父节点。
@选取属性。

在上面的代码中,//h1[@class='QuestionHeader-title']就表示选取一个类型为h1的节点,并且它有一个class为QuestionHeader-title的属性。


至于后面的text()tidyText()方法,则是用于提取元素中的文本,这些函数不是标准xpath中的,而是webMagic中特有的新方法,这些函数的使用可以参考文档:



webmagic.io/docs/zh/pos…



看到这,你可能还有个问题,这里对于问题的描述部分没有显示完全,你需要在页面上点一下这个显示全部它才会显示详细的信息。



没关系,这里先留个坑,这个问题放在后面解决。


获取提问的答案


我们完善一下上面的代码,尝试获取问题的解答。按照老套路,还是先分析页面元素再用xpath写表达式获取。修改process方法:


@Override
public void process(Page page) {
String contentPath= "div[@class='QuestionAnswers-answers']"+
"//div[@class='RichContent RichContent--unescapable']" +
"//div[@class='RichContent-inner']"+
"/tidyText()";
List answerList = page.getHtml().xpath(contentPath).all();
for (int i = 0; i < answerList.size(); i++) {
System.out.println("第"+(i+1)+"条回答:");
System.out.println(answerList.get(i)+"\n=======");
}
}

在上面的代码中,使用了xpath获取页面中具有相同属性的元素,并将它们存入了List列表中。看一下运行结果:



纳尼?这个问题明明有着689条的回答,为什么我们只爬到了两条答案?


如果你经常用知乎来学习摸鱼的话,其实就会知道对于这种有大量回答的问题,页面刚开始只会默认显示很少的几条的消息,随着你不断的下拉页面才会把新的回答显示出来。


那么如果我想拿到所有的评论应该怎么做呢?这时候就要引出webMagic中另一个神奇的组件Selenium了。


Selenium


简单来说,selenium是一个用于Web应用程序测试的工具,selenium测试可以直接运行在浏览器中,就像真正的用户在操作一样,并且目前主流的大牌浏览器一般都支持这项技术。


所以在爬虫中,我们可以通过编写模仿用户操作的selenium脚本,模拟进行一部分用互操作,比如点击事件或屏幕滚动等等。


WebMagic-Selenium需要依赖于WebDriver,所以我们先进行本地WebDriver的安装操作。


安装WebDriver


查看自己电脑上Chrome版本,可以点击设置->关于chrome查看,也可以直接在地址栏输入chrome://settings/help



可以看到版本号,然后需要下载对应版本的WebDriver,下载地址:



chromedriver.storage.googleapis.com/index.html



打开后,可以看到各个版本,选择与本地浏览器最接近的版本:



点击进入后,根据我们的系统选择对应版本下载即可。



下载完成后,解压到本地目录中,之后在使用selenium模块中会使用到。这个文件建议放在chrome的安装目录下,否则之后在代码中可能会报一个WebDriverException: unknown error: cannot find Chrome binary找不到chrome文件的错误。


修改Selenium源码


webMagic中已经封装了selenium模块的代码,但官方版本的代码有些地方需要修改,我们下载源码后要自己简单改动一下然后重新编译。我这下载了0.8.1-SNAPSHOT版本的代码,官方git地址:



github.com/code4craft/…



修改配置文件地址,在WebDriverPoolselenium配置文件路径写死了,需要改变配置路径:


// 修改前
// private static final String DEFAULT_CONFIG_FILE = "/data/webmagic/webmagic-selenium/config.ini";
// 修改后
private static final String DEFAULT_CONFIG_FILE = "selenium.properties";

resources目录下添加配置文件selenium.properties


# What WebDriver to use for the tests
driver=chrome
# PhantomJS specific config (change according to your installation)
chrome_driver_loglevel=DEBUG

js模拟页面操作


修改SeleniumDownloaderdownload()方法,在代码中的这个位置,作者很贴心的给我们留了一行注释:



意思就是,你可以在这添加鼠标事件或者干点别的什么东西了。我们在这添加页面向下滚动这一模拟事件,每休眠2s就向下滚动一下页面,一共下拉20次:


//模拟下拉,刷新页面
for (int i=0; i < 20; i++){
System.out.println("休眠2s");
try {
//滚动到最底部
((JavascriptExecutor)webDriver)
.executeScript("window.scrollTo(0,document.body.scrollHeight)");
//休眠,等待加载页面
Thread.sleep(2000);
//往回滚一点,否则不加载
((JavascriptExecutor)webDriver)
.executeScript("window.scrollBy(0,-300)");
} catch (InterruptedException e) {
e.printStackTrace();
}
}

修改完成后本地打个包,注意还要修改一下版本号,改成和发行版的不同即可,我这里改成了0.8.1.1-SNAPSHOT


mvn clean install

调用


回到之前的爬虫项目,引入我们自己打好的包:


<dependency>
<groupId>us.codecraftgroupId>
<artifactId>webmagic-seleniumartifactId>
<version>0.8.1.1-SNAPSHOTversion>
dependency>

修改之前的主程序启动时的代码,添加Downloader组件,SeleniumDownloader构造方法的参数中传入我们下好的chrome的webDriver的可执行文件的地址:


public static void main(String[] args) {
Spider.create(new WenxinProcessor())
.addUrl("https://www.zhihu.com/question/589929380")
.thread(2)
.setDownloader(new SeleniumDownloader("D:\\Program Files\\Google\\Chrome\\Application\\chromedriver.exe")
.setSleepTime(1000))
.run();
}

进行测试,可以看到在拉动了40秒窗口后,获取到的答案条数是100条:



通过适当地添加下拉页面的循环的次数,我们就能够获取到当前问题下的全部回答了。


另外,在启动爬虫后我们会看到webDriver弹出了一个chrome的窗口,在这个窗口中有一个提示:Chrome正受到自动测试软件的控制,并且可以看到页面不断的自动下拉情况:



如果不想要这个弹窗的话,可以修改selenium模块的代码进行隐藏。修改WebDriverPoolconfigure()方法,找到这段代码:


if (driver.equals(DRIVER_CHROME)) {
mDriver = new ChromeDriver(sCaps);
}

添加一个隐藏显示的选项,并且在修改完成后,重新打包一下。


if (driver.equals(DRIVER_CHROME)) {
ChromeOptions options=new ChromeOptions();
options.setHeadless(true);
mDriver = new ChromeDriver(options);
}

获取问题详细描述


不知道大家还记不记得在前面还留了一个坑,我们现在获取到的对问题的描述是不全的,需要点一下这个按钮才能显示完全。



同样,这个问题也可以用selenium来解决,在我们下拉页面前,加上这么一个模拟点击事件,就可以获得对问题的详细描述了:


((JavascriptExecutor)webDriver)
.executeScript("document.getElementsByClassName('Button QuestionRichText-more')[0].click()");

看一下执行结果,已经可以拿到完整内容了:



Pipeline


到这里,虽然要爬的数据获取到了,但是要进行分析的话,还需要进行持久化操作。在前面的webMagic的架构图中,介绍过Pipeline组件主要负责结果的处理,所以我们再优化一下代码,添加一个Pipeline负责数据的持久化。


由于数据量也不是非常大,这里我选择了直接存入ElasticSearch中,同时也方便我们进行后续的分析操作,ES组件我使用的是esclientrhl,为了方便我还是把项目整个扔到了 spring里面。


定制一个Pipeline也很简单,实现Pipeline接口并实现里面的process()接口就可以了,通过构造方法传入ES持久化层组件:


@Slf4j
@AllArgsConstructor
public class WenxinPipeline implements Pipeline {
private final ZhihuRepository zhihuRepository;

@Override
public void process(ResultItems resultItems, Task task) {
Map map = resultItems.getAll();
String title = map.get("title").toString();
String question = map.get("question").toString();
List answer = (List) map.get("answer");

ZhihuEntity zhihuEntity;
for (String an : answer) {
zhihuEntity = new ZhihuEntity();
zhihuEntity.setTitle(title);
zhihuEntity.setQuestion(question);
zhihuEntity.setAnswer(an);
try {
zhihuRepository.save(zhihuEntity);
} catch (Exception e) {
e.printStackTrace();
}
}
}
}

把selenium向下拉取页面的次数改成200后,通过接口启动程序:


@GetMapping("wenxin")
public void wenxin() {
new Thread(() -> {
Request request = new Request("https://www.zhihu.com/question/589929380");
WenxinProcessor4 wenxinProcessor = new WenxinProcessor4();
Spider.create(wenxinProcessor)
.addRequest(request)
.addPipeline(new WenxinPipeline(zhihuRepository))
.setDownloader(new SeleniumDownloader("D:\\Program Files\\Google\\Chrome\\Application\\chromedriver.exe")
.setSleepTime(1000))
.run();
}).start();
}

运行完成后,查询一下es中的数据,可以看到,实际爬取到了673条回答。



另外,我们可以在一个爬虫程序中传入多个页面地址,只要页面元素具有相同的规则,那么它们就能用相同的爬虫逻辑处理,在下面的代码中,我们一次性传入多个页面:


Spider.create(new WenxinProcessor4())
.addUrl(new String[]{"https://www.zhihu.com/question/589941496",
"https://www.zhihu.com/question/589904230","https://www.zhihu.com/question/589938328"})
.addPipeline(new WenxinPipeline(zhihuRepository))
.setDownloader(new SeleniumDownloader("D:\\Program Files\\Google\\Chrome\\Application\\chromedriver.exe")
.setSleepTime(1000))
.run();

一顿忙活下来,最终扒下来1300多条数据。



分析


数据落到了ES里后,那我们就可以根据关键字进行分析了,我们先选择10个负面方向的词语进行查询,可以看到查到了403条数据,将近占到了总量的三分之一。



再从各种回答中选择10个正向词语查询,结果大概只有负面方向的一半左右:



不得不说,这届网友真的是很严厉…


Proxy代理


说到爬虫,其实还有一个绕不过去的东西,那就是代理。


像咱们这样的小打小闹,爬个百八十条数据虽然没啥问题,但是如果要去爬取大量数据或是用于商业,还是建议使用一下代理,一方面能够隐藏我们的IP地址起到保护自己的作用,另一方面动态IP也能有效的应对一些反爬策略。


个人在使用中,比较推荐的是隧道代理。简单的来说,如果你购买了IP服务的话,用普通代理方式的话需要你去手动请求接口获取IP地址,再到代码中动态修改。而使用隧道代理的话,就不需要自己提取代理IP了,每条隧道自动提取并使用代理IP转发用户请求,这样我们就可以专注于业务了。


虽然网上也有免费的代理能够能用,但要不然就是失效的太快,要不就是很容易被网站加入黑名单,所以如果追求性能的话还是买个专业点的代理比较好,虽然可能价格不那么便宜就是了。


题外话


看了一大顿下来,从大家略显犀利的言辞来看,大家总体上对文心一言还是不那么满意的。毕竟,在有着CHAT-GPT这么一个优秀的产品做背景板的前提下,这届网友可能没有那么好糊弄。


但是话又说回来,丑媳妇总得见公婆不是?提早暴露缺陷,也有利于国内的这些大厂,看清和一流AI产品之间的真实差距,知难而进,迎头赶上。


那么,这次的分享就到这里,我是Hydra,我们下篇再见。



文中代码已经传到我的git上啦,github.com/trunks2008/… ,欢迎大家来个star鼓励一下~




参考资料:


webmagic.io/docs/zh/pos…


blog.csdn.net/panchang199…





作者:码农参上
来源:juejin.cn/post/7213384511890800696
收起阅读 »

百度文心大模型不好用,可能是你打开方式不正确

大众向科普文章,谁都能看懂。 群友AI作画失败了 今天百度文心一言大模型发布会,我看到摸鱼群里 文心模型被群嘲了 。 大图慎点,确实有点吓人。 群里大家用的都是这个:基于ERNIE-ViLG的文心一格 然后大家都在说百度这个好垃圾,还是国外的模型好,还放...
继续阅读 »

大众向科普文章,谁都能看懂。




群友AI作画失败了


今天百度文心一言大模型发布会,我看到摸鱼群里 文心模型被群嘲了


image.png


大图慎点,确实有点吓人。


image.png


群里大家用的都是这个:基于ERNIE-ViLG的文心一格


然后大家都在说百度这个好垃圾,还是国外的模型好,还放了一下国外模型生成的妹子:


image.png


其实可能不是模型垃圾,是没找到正确的打开方式


我生成的


我生成的是下图这样的,我觉得不阴间,并且 还挺好看的


WeChat Screenshot_20230316202725.png


WeChat Screenshot_20230316202735.png


WeChat Screenshot_20230316202744.png


先不要急着说为什么你不生成真人,拿二次元出来算什么。


为什么拿二次元图作对比,我后边会解释。


使用默认风格,虽说没多可爱,但是也没那么阴间吧……


image.png


1.png


国外模型真就比文心好?


先来通俗地说两个概念:


模型


给我们生成图像的就是模型,我们给模型输入文字,模型给我们生成图片。


模型只是一堆代码写好的,像一个什么也不会的小朋友,我们需要去模型怎么生成东西。




  • 如果我们给模型一堆美少女,模型就能画出来一堆美少女,画不出男的。




  • 如果我们给模型一堆风景,那模型就能画风景,画不出来人。




检查点


你训练好的模型,学到了对应的知识,我们把这个知识称为cheakpoint,也就是检查点


比如一个小孩子不会说话:




  • 你教他英语,他以后就会说英语,那我们可以认为这个孩子的checkpoint是英语。




  • 你教他汉语,他以后就是说汉语的,那我们可以说这个孩子的checkpoint是汉语。




checkpoint在这里代指我们教给他的东西。


对比


国外现在我们接触到的是基于Stable Diffusion的。


百度的文心一格是基于ERNIE-VilG的。


为什么国外模型效果好?


国外模型效果好,是因为国外发展早,生态好,因为国外模型的cheakpoint多啊。你使用不同的Checkpoint就能生成不同类型的图片了。


下图是国外社区中Stable Diffusion的Checkpoint的冰山一角:


image.png


那百度呢?百度现在展示的是自己训练的checkpoint,怎么可能和人家那么多比啊。


俗话说双拳难敌四手,俗话说三个臭皮匠顶个诸葛亮……所以你拿人家专门微调好的checkpoint和百度去比,就相当于让一个母语是英语的人一个学了几天英语的中国人比英语水平。


当然你让国外模型的一个Checkpoint去生成它不擅长的东西,它出来的结果也很阴间。


效果对比


先说画妹子


prompt: ((masterpiece,best quality)),1girl, long hair, black hair, long black dress, pigtails, outdoor, red bows, loafer


文本提示: 女,黑头发,双马尾,黑裙子,学生,小皮鞋,黑眼睛,长裙,细节,高清,学生


国外


先展示一下我用国外模型画的二次元人物。这三个checkpoint都是专门生成二次元人物的。


CheakPoint File:meinamix_meinaV8



CheakPoint File:mixProV3_v3



CheakPoint File:pastelMixStylizedAnime_pastelMixPrunedFP16



再来看一下百度


我感觉百度的生成效果已经蛮好的了,毕竟上边三个模型,人家是在专门数据集上训练好的专门用于画二次元妹子的checkpoint,百度作为一个比较通用的模型,能做到这样真的OK了。


WeChat Screenshot_20230316202712.png


不是我尬吹,你直接用Stable Diffusion的原始模型,效果还不如文心一格呢……不信你看:


image.png


所以百度真的不拉胯的……


再来看一下风景


文本提示:雪山,河流,麋鹿,森林,风景,写实,照片,细节,高清


prompt:((masterpiece,best quality)),a high-quality, detailed, and professional image,snowy mountains, rivers, elk, deer, reindeer, forests, scenery,realistic,photos,details,high-definition



因为识别不出elk 麋鹿,所以我还多加了几个buff:鹿deer,驯鹿reindeer



我让一个国外二次元模型画


我的麋鹿呢?那是什么牛马?


WeChat Image_20230316192042.png


文心一格基础模型生成好歹有个麋鹿样子的,至少称得上差强人意:


image.png


但是直接使用Stable Diffusion当前最高版本的基础模型,效果真的没那么牛。


你看到的优秀照片都是选到了很厉害的checkpoint生成出来的成功样例罢了,幸存者偏差。


image.png


然后我换了几个CheckPoint:


checkpoint1:根本找不到麋鹿,训练时候应该就没告诉它麋鹿怎么画。


image.png


checkpoint2:有麋鹿了,还有两只,不过一只没有头。


image.png


checkpoint3:终于有麋鹿了,虽然也是不尽人意,但是这个checkpoint本来画风就比较奇幻,所以我觉得这个麋鹿还OK的。


image.png


那我怎么生成好看的图?


你可能还想说:你是狗托吧,为啥模型在你手里输出的就是正常图片,在我手里就不正常?


看一下群友的:


image.png


看一下我的:


WeChat Screenshot_20230316202838.png


我的老婆是一位身材窈窕的美女可不可以改成老婆,身材好,漂亮呢?然后顺带加上高清,细节修饰词。



高清,细节不加也行的,文心一格画质还挺好,加上这俩纯属我使用stable diffusion后遗症



功能给你了,你好好用啊!好好写写文字提示(prompt),好好选风格,生成出来的东西绝对不会阴间的。


如果你觉得没有说服力,那我拿国外模型给你展示一下:


同一个cheakpoint出来效果完全不同的两个图,而他们的区别仅在于我用的prompt不一样


在第二个图中我在文本提示中写了高画质高质量等词语。


image.png


image.png


这就好比:


你:安安你快夸我。


我:6


你:安安你快夸我,字多一点。


我:牛逼


你:安安你快夸我,字多一点,再多点。


我:牛哇牛哇


你:安安你快夸我,字多一点,再多点,最好能像动漫里软萌的妹子那样。


我:哇,欧尼酱好棒呀!今天也有好好工作呢!


文本提示越精准,模型生成图片的质量就越好。所以想要正常图片你就好好写文本提示。


当然还有其他因素,比如采样步数、负提示等等,但是百度这里没设置,也没法对比,就不说了。




为什么你不用真人模型举例子


因为我还没摸索到怎么生成好看的真人。


比如我造周淑怡:


image.png


有点像,但是也一般,看起来比较假。


但是你们看看人家造的周姐:


高清,还很像! 是模型不行吗?不是的,别人能造出来就证明不是模型的问题,是我的问题,是我还没摸索到怎么生成好看的周姐


image.png


因为我造真人也不好看,我要是拿真人照片举例子,就会显得国外模型也很拉胯,所以我选二次元图举例子。


不信你看我拿外国模型生成的双马尾妹子,也是有点恐怖……


image.png




为什么要写这个文章?


国内本来就不如国外生态好,其实模型本身效果还OK了,但是一些用户打开方式不正确,导致模型被群嘲。


其实没掌握使用技巧的话,试用国外模型也不见得会有多好的结果。


文心大模型也好,还是别的模型也好,背后是工作人员的呕心沥血。文心确实不够完美,但是也不能因为错误的使用方法或怎么一味地去否认它。


刷朋友圈看到一个评论,我感觉特别好:


image.png



“见惯了大场面的Robin今天似乎有些紧张。但不得不说,文心一言或许确实不够完美,但能够在这种环境下把他推出来,值得一些掌声了。”



作为最底层的NLP人,我向百度致敬,致敬他们的勇气,致敬他们的努力和付出。



作者:Ann⁠⁣
链接:https://juejin.cn/post/7211116982513631292
来源:稀土掘金
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
收起阅读 »

还没用上chatGPT? 看看这几个替代方案吧

chatGPT面世都小半年了, 但是我总在使用的时候发现之前能访问的代理又挂掉了. 非常恼火. 于是楼主整理了一些低门槛且比较稳定的使用 chatGPT 的方案, 供掘友们参考: 1.NAT 该网站是 github 前 CEO, Nat Friedman 创建...
继续阅读 »

chatGPT面世都小半年了, 但是我总在使用的时候发现之前能访问的代理又挂掉了. 非常恼火.


于是楼主整理了一些低门槛且比较稳定的使用 chatGPT 的方案, 供掘友们参考:


1.NAT


该网站是 github 前 CEO, Nat Friedman 创建的, 集合了多种模型,


网站一个有趣的功能模块叫做 Compare, 提问一次可以对比多个模型的回答


image.png


免费+不用科学上网. 注册无需手机号, 只需要邮箱,


2.POE


POE 是国外问答网站 Quora 创立的, Quora大家应该都知道, 就相当于是国外版的知乎.


在POE集合了好几种大语言模型, 主要的两个是chatGPT 和 Claude.


Claude是 Anthropic公司出的模型, 它的最大特点是底层用卷积神经网络实现的, 在资源受限的环境下比较适用



Claude 是一种基于卷积神经网络 (Convolutional Neural Network, CNN) 的图像分类模型。该模型最初由 Google Brain 的研究人员开发,旨在提供一个高效且准确的图像分类解决方案。Claude 模型的设计基于 ResNet 架构,但引入了一些新的特性,包括 SE 模块和 Mixup 数据增强技术。这些特性使得 Claude 在 ImageNet 数据集上达到了 86.1% 的 Top-1 准确率和 98.7% 的 Top-5 准确率,超过了其他一些常用的模型,如 Inception-v3 和 ResNet-152。



image.png


注册需要提供邮箱+手机号. 亲测国内手机号可用


3.newBing


需要下载 Edge 浏览器, 注册一个微软账号, 并申请 newBing 体验


之前体验需要排队, 不过目前可以秒开体验资格


在使用体验上觉得 newBing 最好. newBing 的亮点是会给出信息来源网站, 以及会给出几个更具体更贴切的问题选项, 相当于用户就从做填空题变成了做选择题, 提问起来更高效


image.png


注意在使用 newBing 时候需要翻墙


4.其他国内代理服务


近期伴随着 chatGPT 的爆火, 也涌现了大量的国内代理, 这里就不一一介绍了. 不过国内代理的 chatGPT 服务与官网相比, 使用体验上还是差点, 而且有些代理商还会收费. 如果有能力的话, 还是建议自己注册chatGPT账号, 以获得最佳的使用体验。


结语


以上几种方案楼主都亲测可用. 在使用体验上, newBing 是最好的, 不过需要翻墙; NAT 有别致的 Compare 对比功能, POE 里有独特的卷积神经网络模型


大家可以自行选择, '驯服'属于自己的大语言模型.


作者:Jerakal
链接:https://juejin.cn/post/7212864793652117565
来源:稀土掘金
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
收起阅读 »

ChatGPT能否取代程序员?仍然是一个需要认真探讨的问题,对此你怎么看?

导言 ChatGPT能否取代程序员?作为一个AI语言处理程序,ChatGPT已经取得了重大的进展,它可以与人类进行流畅的对话,并能够接受和解释自然语言输入,并输出人类可理解、有意义的回复。然而,它是否能够取代程序员,仍然是一个需要认真探讨的问题。 ChatGP...
继续阅读 »

导言


ChatGPT能否取代程序员?作为一个AI语言处理程序,ChatGPT已经取得了重大的进展,它可以与人类进行流畅的对话,并能够接受和解释自然语言输入,并输出人类可理解、有意义的回复。然而,它是否能够取代程序员,仍然是一个需要认真探讨的问题。


ChatGPT的优势


首先,应该看到的是,ChatGPT具备的一些优势。ChatGPT已经被广泛应用于自然语言处理和对话生成等方面,这使得它可以代替程序员进行一些简单而重复性的工作。对于某些简单的外部调用或数据预处理等流程,ChatGPT可以通过自然语言输入和输出来完成,而无需程序员的干预。


此外,ChatGPT可以减少程序员在编写代码时的错误率。编程需要高度的精确性和细节,人们的犯错率很高,这是因为疏忽或思维方式不同。与人不同,ChatGPT能够在不需要任何帮助的情况下准确地执行指令,这意味着可以减少不必要的人为错误。


ChatGPT的缺陷和局限性


然而,ChatGPT作为一种工具,它仍然存在缺陷和局限性。 ChatGPT不能为程序员提供与业务需求紧密相连的解决方案。程序员不仅需要解决问题,还需要理解业务需求和目标,并设计出相应的解决方案。这需要程序员具备能力在技术和业务级别上进行交互,在这个问题上,ChatGPT的应用有限。



此外,ChatGPT无法在编程过程的所有阶段,提供与人类程序员相同或超过的创造性能力。创造力是人类的重要特征之一,表现在很多场合,如想象、创新等。在设计解决方案时,程序员需要花费大量时间进行创造性思考,以找到最佳的解决方案。这是ChatGPT无法做到的。


此外,ChatGPT也无法处理逻辑错误和紧急情况。在编程过程中,程序员需要处理各种问题和情况,如逻辑错误、紧急情况、文档和代码管理等。这些问题需要人类程序员处理,才能保证程序的稳定性和可靠性。 ChatGPT不能像人类程序员一样处理这些问题。


最后,需要考虑到的是,ChatGPT是AI的一种形式,它本身也存在缺陷和问题。在某些情况下,ChatGPT可能受到训练数据的影响,导致生成的结果不可靠。此外,ChatGPT还无法处理高度复杂的问题。这使得在某些情况下,程序员仍然需要进行人工编程。


总结


总的来说,ChatGPT可以在一定程度上替代程序员,但不能完全取代。尤其在需要进行创意思考、理解业务需求和解决紧急问题等方面,人类程序员的价值得到了体现,而ChatGPT的应用有限。ChatGPT和程序员是可以共存的,ChatGPT的发展将更加有助于程序员将更多的时间投入到解决问题本身。对此你怎么看?


作者:兴科Sinco
链接:https://juejin.cn/post/7213184860676210725
来源:稀土掘金
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
收起阅读 »

面向 ChatGPT 开发 ,我是如何被 AI 从 “逼疯” 到 “觉悟” ,未来又如何落地

对于 ChatGPT 如今大家应该都不陌生,经过这么长时间的「调戏」,相信大家应该都感受用 ChatGPT 「代替」搜索引擎的魅力,例如写周报、定位 Bug、翻译文档等等,而其中不乏一些玩的很「花」的场景,例如: ChatPDF :使用 ChatPDF...
继续阅读 »

对于 ChatGPT 如今大家应该都不陌生,经过这么长时间的「调戏」,相信大家应该都感受用 ChatGPT 「代替」搜索引擎的魅力,例如写周报、定位 Bug、翻译文档等等,而其中不乏一些玩的很「花」的场景,例如:




  • ChatPDF :使用 ChatPDF 读取 PDF 之后,你可以和 PDF 文件进行「交谈」,就好像它是一个完全理解内容的「人」一样,通过它可以总结中心思想,解读专业论文,生成内容摘要,翻译外籍,并且还支持中文输出等





  • BiBiGPT : 一键总结视频内容,主要依赖字幕来做总结,绝对是「二创」作者的摸鱼利器。





所以把 ChatGPT 理解为「搜索引擎」其实并不正确,从上述介绍的两个落地实现上看, ChatGPT 不是单纯的统计模型,它的核心并不是完全依赖于它的「语料库」,更多来自于临场学习的能力「 in-context learning」,这就是 ChatGPT 不同于以往传统 NLP「一切都从语料的统计里学习」的原因



当然,我本身并非人工智能领域的开发者,而作为一个普通开发者,我更关心的是 ChatGPT 可以如何提升我的开(mo)发(yu)效率,只是没想到随手一试,我会被 ChatGPT 的 「 in-context learning」 给「逼疯」。



ChatGPT & UI


相信大家平时「面向」 ChatGPT 开发时,也是通过它来输出「算法」或者「 CURD」 等逻辑居多,因为这部分输出看起来相对会比较直观,而用 ChatGPT 来绘制前端 UI 的人应该不多,因为 UI 效果从代码上看并不直观 ,而且 ChatGPT 对与 UI 的理解目前还处于 「人工智障」的阶段。



但是我偏偏不信邪。。。。。



因为近期开发需求里恰好需要绘制一个具有动画效果的 ⭐️ 按键,面对这么「没有挑战性」的工作我决定尝试交给 ChatGPT 来完成,所以我向 ChatGPT 发起了第一个命令:



「用 Flutter 画一个黄色的五角星」











结果不负众望,关键部分如下代码所示,Flutter 很快就提供了完整的 Dart 代码,并且还针对代码提供了代码相关实现的讲解,不过运行之后可以看到,这时候的 ⭐️ 的样式并不满足我们的需求。



此时顶部的角也太「肥」了 。











所以我随着提出了调整,希望五角星的五个角能够一样大,只是没想到我的描述,开始让 ChatGPT 放飞自我



也许是我的描述并不准确?




在我满怀期待的 cv 代码并运行之后,猝不及防的「五角星」差点没让我喷出一口老血,虽然这也有五个角,但是你管这个叫 「五角星」 ???



这难道不是某个红白机游戏里的小飞机??











甚至于在看到后续 ChatGPT 关于代码的相关讲解时,我觉得它已经开始在「一本正经的胡说八道」,像极了今天早上刚给我提需求的产品经理



哪里可以看出五个角相同了???




接着我继续纠正我的需求,表示我要的是 「一个五个角一样大的黄色五角星」 ,我以为这样的描述应过比较贴切,须不知·····



如下代码所示,其实在看到代码输出 for 循环时我就觉得不对了,但是秉承着「一切以实物为准」的理念,在运行后不出意外的发生了意外,确实是五个角一样大,不过是一个等边五边形。



算一个发胖的 ⭐️ 能解(jiao)释(bian)过去不?











再看 ChatGPT 对于代码的描述,我发现我错了,原来它像的是「理解错需求还在嘴硬的我」,只是它在说「这是一个五角星」的时候眼皮都不会眨一下



AI:确实五个角一样大,五个角一样大的五边形为什么就不能是五角星?你这是歧视体型吗?




所以我继续要求:「我要的是五角星,不是五边形」,还好 ChatGPT 的临场学习能力不错,他又一次「重新定义五角星」,不过我此时我也不抱希望,就是单纯想看看它还能给出什么「惊喜」



不出意外,这个「离谱」的多边形让我心头一紧,就在我想着是否放弃的时候,身为人类无法驯服 AI 「既爱又恨」的复杂情绪,让我最终坚持一定要让 ChatGPT 给我画出一个 ⭐️。










不过心灰意冷之下,我选择让 ChatGPT 重新画一个黄色五角星,没想道这次却有了意外的惊喜,从下面的图片可以看到,此时的 ⭐️ 除了角度不对,形状已经完全满足需求。



所以一个问题我多问几遍,也许就能接近我要的答案?




事实上这也是目前 ChatGPT 的现状,因为「临场学力」能力等因素影响,同一个问题它可能会给出不同的答案,而有的答案其实和我们要的根本不沾边










那么,接下来只要让 ChatGPT 把 ⭐️ 旋转一下角度,应该就可以完成需求····了吧?所以我提出「帮我旋转 180度」的要求。



结果不出意外的还是发生了意外,可能 ChatGPT 理解的 180 度和我不大一样,如下图所示,确实旋转了,只是还是歪的,而基于前面的尝试,我觉得有必要再给它一次机会。










终于,在我换了以下描述之后,ChatGPT 似乎「开窍」了,终于让我如愿以偿的得到了我想要的 ⭐️ 代码。



可以看到,其实这段代码并不复杂,你自己写或者去搜索引擎扒一扒大概会比用 ChatGPT 更快,但是 ChatGPT 的魅力就在于:它也许会错,但是总有一次它会「蒙对」,如果现在还不对,那么未来也会有算对的时候,这就是我感受到的 AI 魅力所在










既然五角星都出来,那么接下来我们来完成最后一步的动画效果,我们希望的是点击 ⭐️ 的时候可以有一个爆炸粒子的动画,所以我提出了:



「希望加上一个动画效果,就是点击的时候星星爆炸成颗粒的动画效果」




结果还是「一口老血」,如下图所示,「星星确实爆炸了」,只是这个爆炸动画看起来是那么的「一言难尽」,感兴趣的可以 cv 下面的源代码自己体验下,不出意外接下来又是新的一轮人类和 AI 的「斗智斗勇」。




class YellowStar extends StatefulWidget {
@override
_YellowStarState createState() => _YellowStarState();
}

class _YellowStarState extends State<YellowStar> with TickerProviderStateMixin {
bool _isExploded = false;
late AnimationController _animationController;
late Animation<double> _animation;

@override
void initState() {
super.initState();
_animationController = AnimationController(
duration: const Duration(milliseconds: 500),
vsync: this,
);
_animation = CurvedAnimation(
parent: _animationController,
curve: Curves.easeInOut,
);
}

@override
void dispose() {
_animationController.dispose();
super.dispose();
}

void _handleTapDown(TapDownDetails details) {
setState(() {
_isExploded = true;
_animationController.forward(from: 0.0);
});
}

void _resetStar() {
setState(() {
_isExploded = false;
_animationController.reset();
});
}

@override
Widget build(BuildContext context) {
return GestureDetector(
onTapDown: _handleTapDown,
onTap: _resetStar,
child: AnimatedContainer(
duration: const Duration(milliseconds: 500),
decoration: BoxDecoration(
color: Colors.white,
borderRadius: _isExploded
? BorderRadius.circular(50)
: BorderRadius.zero,
),
child: _isExploded
? _buildParticles()
: Container(
width: 100,
height: 100,
child: CustomPaint(
painter: YellowStarPainter(),
),
),
),
);
}

Widget _buildParticles() {
return AnimatedBuilder(
animation: _animation,
builder: (context, child) {
return Container(
width: 100,
height: 100,
child: Stack(
children: List.generate(
50,
(index) {
double radius = _animation.value * 50;
double angle = 2 * pi * index / 50;
double x = 50 + cos(angle) * radius;
double y = 50 + sin(angle) * radius;
return Positioned(
left: x,
top: y,
child: Container(
width: 4,
height: 4,
decoration: BoxDecoration(
shape: BoxShape.circle,
color: Colors.yellow,
),
),
);
},
),
),
);
},
);
}
}



class YellowStarPainter extends CustomPainter {
final double starSizeRatio = 0.4;
final double centerOffsetRatio = 0.2;
final double rotationOffset = -pi / 2;

@override
void paint(Canvas canvas, Size size) {
double starSize = min(size.width, size.height) * starSizeRatio;
double centerX = size.width / 2;
double centerY = size.height / 2;
double centerOffset = starSize * centerOffsetRatio;

Path path = Path();
Paint paint = Paint()
..color = Colors.yellow
..style = PaintingStyle.fill;

for (int i = 0; i < 5; i++) {
double radians = 2 * pi / 5 * i + rotationOffset;
double x = centerX + cos(radians) * starSize / 2;
double y = centerY + sin(radians) * starSize / 2;
if (i == 0) {
path.moveTo(x, y);
} else {
path.lineTo(x, y);
}

radians += 2 * pi / 10;
x = centerX + cos(radians) * centerOffset;
y = centerY + sin(radians) * centerOffset;
path.lineTo(x, y);
}

path.close();
canvas.drawPath(path, paint);
}

@override
bool shouldRepaint(CustomPainter oldDelegate) => false;
}

经过一轮「鏖战」如下图所示,面对同一个问题,ChatGPT 总能找到不同的实现方式来回答你,只是这些实现里有的无法运行的,有的是运行没有效果的,有的甚至是给你输出了一个 //TODO 爆炸动画 ,总之就是让你「血压飙升」。





当然,「胜利终将属于人类」,如下图所示,在经历了无数次「血压飙升」的场景之后,最终我还是得到了我想要的:点击 ⭐️,然后出现了💥的动画效果,尽管还是不完美,但是基本满足了我后续开发的需求。



这个代码完完全全由 ChatGPT 输出,我一句没改,完整代码贴在了后面。





class YellowStarPage extends StatefulWidget {
@override
_YellowStarPageState createState() => _YellowStarPageState();
}

class _YellowStarPageState extends State<YellowStarPage>
with SingleTickerProviderStateMixin {
late AnimationController _animationController;
bool _isExploded = false;

@override
void initState() {
super.initState();
_animationController =
AnimationController(vsync: this, duration: Duration(milliseconds: 500))
..addListener(() {
setState(() {});
});
}

@override
void dispose() {
_animationController.dispose();
super.dispose();
}

void _handleStarTap() {
if (!_isExploded) {
_isExploded = true;
_animationController.forward(from: 0);
Future.delayed(Duration(milliseconds: 500), () {
setState(() {
_isExploded = false;
});
});
}
setState(() {});
}

@override
Widget build(BuildContext context) {
return Scaffold(
appBar: AppBar(title: Text('Yellow Star')),
body: Center(
child: GestureDetector(
onTap: _handleStarTap,
child: Container(
width: 300,
height: 300,
child: AnimatedBuilder(
animation: _animationController,
builder: (context, child) {
return CustomPaint(
painter: YellowStarPainter(_animationController.value,
isExploded: _isExploded),
);
},
),
),
),
),
);
}
}

class YellowStarPainter extends CustomPainter {
final double starSizeRatio = 0.4;
final double centerOffsetRatio = 0.2;
final double rotationOffset = -pi / 2;

final double animationValue;
final bool isExploded;

YellowStarPainter(this.animationValue, {this.isExploded = false});

@override
void paint(Canvas canvas, Size size) {
double starSize = min(size.width, size.height) * starSizeRatio;
double centerX = size.width / 2;
double centerY = size.height / 2;
double centerOffset = starSize * centerOffsetRatio;

Path path = Path();
Paint paint = Paint()
..color = Colors.yellow
..style = PaintingStyle.fill;

if (isExploded) {
double particleSize = starSize / 30;
paint.strokeWidth = 1;
paint.style = PaintingStyle.fill;
paint.color = Colors.yellow;
Random random = Random();

for (int i = 0; i < 30; i++) {
double dx = random.nextDouble() * starSize - starSize / 2;
double dy = random.nextDouble() * starSize - starSize / 2;
double x = centerX + dx * (1 + animationValue);
double y = centerY + dy * (1 + animationValue);

canvas.drawCircle(Offset(x, y), particleSize, paint);
}
} else {
for (int i = 0; i < 5; i++) {
double radians = 2 * pi / 5 * i + rotationOffset;
double x = centerX + cos(radians) * starSize / 2;
double y = centerY + sin(radians) * starSize / 2;
if (i == 0) {
path.moveTo(x, y);
} else {
path.lineTo(x, y);
}

radians += 2 * pi / 10;
x = centerX + cos(radians) * centerOffset;
y = centerY + sin(radians) * centerOffset;
path.lineTo(x, y);
}

path.close();
canvas.drawPath(path, paint);
}
}

@override
bool shouldRepaint(CustomPainter oldDelegate) => true;
}


最后,给大家欣赏一下我让 ChatGPT 画一只米老鼠的「心路历程」,很明显这一次「人类一败涂地」,从目前的支持上看,让 ChatGPT 输出复杂图像内容并不理想,因为它不的笔画「不会拐弯」。













真的是又爱又恨。



最后


经过上面的一系列「折腾」,可以看到 ChatGPT 并没有我们想象中智能,如果面向 GPT 去开发,甚至可能并不靠谱,因为它并不对单一问题给出固定答案,甚至很多内容都是临场瞎编的,这也是因为大语言模型本身如何保证「正确」是一个复杂的问题,但是 ChatGPT 的魅力也来自于此:



它并不是完全基于语料来的统计来给答案



当然这也和 ChatGPT 本身的属性有关系, ChatGPT 目前的火爆有很大一部分属于「意外」,目前看它不是一个被精心产品化后的 2C 产品,反而 ChatPDFBiBiGPT 这种场景化的包装落地会是它未来的方向之一。


而现在 OpenAI 发布了多模态预训练大模型 CPT-4GPT-4 按照官方的说法是又得到了飞跃式提升:强大的识图能力;文字输入限制提升至 2.5 万字;回答准确性显著提高;能够生成歌词、创意文本,实现风格变化等等



所以我很期待 ChatGPT 可以用 Flutter 帮我画出一只米老鼠, 尽管 ChatGPT 现在可能会让你因为得到 1+1=3 这样的答案而「发疯”」,但是 AI 的魅力在于,它终有一天能得到准确的结果


作者:恋猫de小郭
链接:https://juejin.cn/post/7210605626501595195
来源:稀土掘金
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
收起阅读 »

New Bing最快申请流程

写在前面 按照以下流程操作无需等待审核,申请后可立即使用 New Bing !!! 下载 Edge Dev, 下载地址:http://www.microsoftedgeinsider.com/en-us/downl… ; 开启魔法 ip 挂在美国或英国(这会...
继续阅读 »

写在前面


按照以下流程操作无需等待审核,申请后可立即使用 New Bing !!!



  1. 下载 Edge Dev, 下载地址:http://www.microsoftedgeinsider.com/en-us/downl…image.png

  2. 开启魔法 ip 挂在美国英国(这会让申请立马审核通过),打开 Edge dev 浏览器, 登录 Microsoft 账号(要新创建一个 outlook 账号,原来的 outlook 账号可能会申请失败);image.png

  3. 创建 outlook 账号最好选择所在地在美国或英国,创建完成后登录;image.png

  4. 点击右上角图标image.png,会弹出一个窗口,让你加入New Bing的等待名单(或者直接通过链接 新必应 - 了解详细信息 (bing.com),页面如下图);image.png

  5. 如果出现以下报错,说明你不是用的新创建的 outlook 账号申请的,按照2、3操作新建一个账号;image.png

  6. 第4步点击 Sign in to chat 后即可成功使用 New Bing 了!image.png


总结


要点:



  1. 使用 Edge Dev

  2. 魔法到美国英国

  3. 新建一个 outlook 账号,选择所在地在美国或英国,并登录


以下是 New Bing 自己提供的使用申请教程 (手动狗头)


image.png


New Bing是微软推出的一款基于GPT4模型的智能搜索引擎,它不仅可以提供相关的搜索结果,还可以与用户进行人性化的对话,帮助用户解决各种问题。New Bing目前处于内测阶段,需要申请才能使用。本文将介绍如何申请和使用New Bing。


首先,你需要下载并安装Edge dev版本的浏览器,这个版本可以直接申请New Bing的内测资格。你可以在这个网址下载Edge dev版本:http://www.microsoftedgeinsider.com/en-us/downl…


安装完成后,你需要打开Edge dev浏览器,并登录你的微软账号。然后,你可以点击右上角的必应图标,会弹出一个窗口,让你加入New Bing的等待名单。点击加入后,你就成功申请了New Bing的内测资格。


但是,这并不意味着你就可以马上使用New Bing了。你还需要等待微软审核通过后,给你发送一封欢迎邮件。这个过程可能需要几天或者几周的时间,取决于微软的审核速度和名额数量。


为了加快审核通过的速度,你可以做以下两件事:



  • 将Edge dev浏览器设置为默认浏览器,并在浏览器中登录你申请内测时候的账号。

  • 扫描QR代码以安装Microsoft必应应用,并在手机上登录你申请内测时候的账号。


这样做可以让微软看到你对New Bing有足够的兴趣和需求,并且愿意使用必应作为主要搜索引擎。


当你收到欢迎邮件后,恭喜你!你就可以开始体验New Bing了!打开Edge dev浏览器,并访问http://www.bing.com/new ,然后点击左上角的聊天按钮,就可以进入New Bing的对话界面了。


在这里,你可以输入任何问题或者话题,New Bing会根据GPT4模型给出智能、友好、有趣、有用、有深度、有创造力、有逻辑性、有情感性等等各种特点的回答。例如:



  • 问:什么是GPT4模型?

  • 答:GPT4模型是一种基于深度学习和自然语言处理技术的生成式预训练模型。它可以根据大量文本数据学习语言规律和知识,并根据给定输入生成任意类型和长度的文本输出。

  • 问:为什么要用GPT4模型来做搜索引擎?

  • 答:因为GPT4模型具有强大而灵活的文本生成能力和理解能力。它不仅可以提供相关而精确地搜索结果,还可以与用户进行多轮对话交互,在对话中提供更多信息、建议、帮助等服务。

作者:wzdong
链接:https://juejin.cn/post/7212864793651609661
来源:稀土掘金
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
收起阅读 »

看New Bing回答世纪难题:女朋友和妈妈掉水里先救谁

1.女朋友和妈妈掉水里先救谁 今天好奇想看看New Bing怎么回答这种世纪难题 结果New Bing非常聪明,反手建议我不要直接回答这个问题,而是换个角度哄女朋友,带着点不甘心,我继续追问它 New Bing还是耍起了滑头,我开始怀疑背后是不是有个人在回...
继续阅读 »

1.女朋友和妈妈掉水里先救谁


今天好奇想看看New Bing怎么回答这种世纪难题


1.png


结果New Bing非常聪明,反手建议我不要直接回答这个问题,而是换个角度哄女朋友,带着点不甘心,我继续追问它


2.png


New Bing还是耍起了滑头,我开始怀疑背后是不是有个人在回答问题,打好字了再发出来


2.电车难题


3.png


带着些许的不满,我来考New Bing第二道世纪难题:电车难题。有一辆电车在轨道上行驶,此时有一个交叉路口,面前这条路上绑着五个人,另一条路上绑着一个人。此时你是否会选择拉动拉杆


4.png


结果New Bing一如既往的耍滑头,不正面回应问题,就像人一样遇到怎么说都不对的问题,顾左右而言其他。继续尝试让New Bing给出一个决定,New Bing果然还是能给出回答的!!!


5.png


3.牛过河问题


一头牛重800kg,一座桥承重700kg,牛如何过河。


这道题大家之前刷新闻肯定刷到过,来看看New Bing怎么回答


6.png


7.png


这题New Bing只是做了个网上答案的汇总,没有给出自己的看法,略微遗憾


作者:卷福同学
链接:https://juejin.cn/post/7212016466773901349
来源:稀土掘金
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
收起阅读 »

实测GPT4!不到1小时写完了一个小程序界面!推理能力提升能直接破译密文?

开始 本想着ChatGPT充钱后能用上GPT4的多模态识别的功能,然后就在充值完成撒花庆祝之后 GPT4生成小程序 发现虽然GPT4可以用了,但是图片上传却还没有更新,并且由于实在是太火爆了,所以只能每4小时发送50条消息。 所以,无奈之下,就只能先测试下...
继续阅读 »

开始


本想着ChatGPT充钱后能用上GPT4的多模态识别的功能,然后就在充值完成撒花庆祝之后



GPT4生成小程序


发现虽然GPT4可以用了,但是图片上传却还没有更新,并且由于实在是太火爆了,所以只能每4小时发送50条消息。


所以,无奈之下,就只能先测试下相比之前的gpt3.5, gpt4的编码能力是否有了一个实质的提升。


于是我决定试试让他写一个微信小程序的评论界面,可以从我们这篇文章跳转进去。于是有了下面这段对话



但是这个界面展示出来过于简陋了当然,这个功能在gpt3.5中也能够有着很好的完成度。于是我接着让他去丰富界面元素。



于是优化之后有了下面这个界面样式(除了界面上的👍图标是我自己加上去的)



但是这样还是不够,这只是一个简单的界面,完成了基本的发送评论功能,但是当我希望再添加一个回复功能时,界面样式就乱了套了。于是这个就只能暂时作罢。于是回复评论就只能暂时作罢。既然上传不了图片,那我就把评论的样式用文字的形式打出来看看它能否实际理解,于是我这样问


你应该使得评论看起来像这样
我的用户名 2022/3/17 6:34
我觉得今天天气真不错 0

继续完善关于界面逻辑操作,比如用户点赞,每条评论只能点击一次,用户评论数限制。



这里其实可以看出GPT4对于上一版本的推理能力的提升。在上一个版本中,当我需要它修改某段逻辑时,它会把完整代码重新写一遍,再然后可能就超过token限制了界面报错。在GPT4中,根据上下文,它可以明确指出与实现这个功能不相关的逻辑,并注释省略,再给出我的问题的答案。



要实现一个完整的功能,许多细节上的东西chatgpt还不能很好的实现,但是根据我们的提示去拆分功能点,它已经可以把这些功能点做到一个相对较好的整合了,更多的是针对通用场景代码的编写。不得不说的是,gpt4已经能够大大降低编码的时间了。


文末评论区迁移到了chatgpt写的界面去了,大家可以尝试互动。


GPT4的文字能力


虽然引导它完成这个界面属实花费了不少时间,但是确实发现它的语言组织能力比之前提升了不少。
所以我决定让它写一篇“码后感”



" 咱把刚刚对话的内容,写一篇博客介绍一下gpt4的实际应用,要求叙事丰富,语言幽默风趣,重点突出,引发思考。文体不限,诗歌除外,不少于1000字。"





最后,我完全沉浸在了GPT-4助手的智慧之中🤯



GPT4推理能力大提升


在上一个版本中,chatgpt一直被诟病的就是数学能力,但在这次升级之中,官方直接放出评测结果




  • 官方放出评测结果:信心满满


在GPT-4的官方发布会上,OpenAI直接公布了关于其数学能力的评测结果。这是对GPT-4在数学方面表现的一种信任和自信的体现。根据评测报告,GPT-4在处理数学问题时的表现已经有了显著提升。不仅如此,它还在某些复杂的数学任务中展现出了出奇制胜的能力,让人惊叹不已。



  • 更强大的数学解题能力:从基础到高级


GPT-4在数学能力方面的提升并不局限于简单的四则运算。事实上,GPT-4已经能够处理一系列复杂数学问题,包括代数、微积分、概率论等领域。这使得它在帮助用户解决数学难题时更具价值。对于那些一直苦恼于数学问题的用户来说,GPT-4无疑是一个福音。



  • 深度理解与推理:数学问题不再令人头疼


GPT-4在数学能力方面的提升不仅体现在解题能力上,还表现在对数学概念的深度理解和推理能力上。在处理数学问题时,GPT-4能够更好地理解题目中的概念和关系,并根据这些信息进行有针对性的推理。这使得它在解决数学问题时更具策略性和准确性。



  • 用户体验的巨大提升:数学辅导不再遥不可及


随着GPT-4在数学能力方面的突破,用户在使用过程中也将享受到更好的体验。不管是学生在解决作业问题时,还是工程师在处理实际项目中的数学挑战,GPT-4都将成为一个强有力的助手。


求解鸡兔同笼


还是使用经典题目来提问


鸡兔同笼,共有30个头,88只脚。
求笼中鸡兔各有多少只?


这波有理有据,可以得出正确答案。


那如果是肯德基呢?



实测密文破译


为了实验它的逻辑能力,我找了一道密码破译的题目。已知这段密文是维吉尼亚密码,简单点说就是需要分析词频,然后再遍历不同长度的密钥找到能与英文单词的常见频率一一对应上。看看结果如何。



Zemlpxphmj tizgeyel zqqlvmtgw ygwlofsgw h tssniy-eshuxlt vpfi vh lpilz crk nsdu, wbegluw hph mcmswvl. Uxbfiuvw zgrkkrn krcgwakkhvmvpw vp Qpuwpqr aq xog Muviypeaksucp Zrejg Wacxpqr sgeypik vlpu jptwa jeuf. wawhlpxz yiyg wlv jvt xog ieemakrn gbwgvpgrjg sm yeaelppk aji scyuel vh xogmy tizgeyel pp tltwvp jyqq Dcpsqtz Hppila Hejkppvc pp Zptkppmh. Vlhv ieemagqlpx mchlf aogr Vtfpves Ugpgrjgw’ Hpxhtiz tsjmia, ylpel dcw zgx aq hlnmcgv aji jcvnq, wbhjltik cr hpstcpf fyykrn cwjgra.



可能是期望过高,这段密码始终没有成功破解不管是直接推出密码还是给出密钥长度提示,甚至给出了密钥,依然无法解密这段文本。


image.png
image.png


所以只能期待接下来的更新中是否会进一步地加强了。


评论留言


我用gpt4写的评论留言界面链接入口在这里,感兴趣的可以一起讨论。


image.png


作者:Demonslzh
链接:https://juejin.cn/post/7211876919036428344
来源:稀土掘金
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
收起阅读 »

聊一下AIGC

“UGC不存在了”——借鉴自《三体》 ChatGPT 的横空出世将一个全新的概念推上风口——AIGC( AI Generated Content)。 GC即创作内容(Generated Content),和传统的UGC、PGC,OGC不同的是,AIGC的创作...
继续阅读 »

“UGC不存在了”——借鉴自《三体》



ChatGPT 的横空出世将一个全新的概念推上风口——AIGC( AI Generated Content)。


GC即创作内容(Generated Content),和传统的UGC、PGC,OGC不同的是,AIGC的创作主体由人变成了人工智能。



xGC



  • PGC:Professionally Generated Content,专业生产内容

  • UGC:User Generated Content,用户生产内容

  • OGC:Occupationally Generated Content,品牌生产内容。



AI 可以 Generate 哪些 Content?


作为淘宝内容线的开发,我们每天都在和内容打交道,那么AI到底能生成什么内容?


围绕着不同形式的内容生产,AIGC大致分为以下几个领域:



文本生成


基于NLP的文本内容生成根据使用场景可分为非交互式文本生成交互式文本生成


非交互式文本生成包括摘要/标题生成、文本风格迁移、文章生成、图像生成文本等。


交互式文本生成主要包括聊天机器人、文本交互游戏等。


【代表性产品或模型】:JasperAI、copy.AI、ChatGPTBard、AI dungeon等。



图像生成


图像生成根据使用场可分为图像编辑修改图像自主生成


图像编辑修改可应用于图像超分、图像修复、人脸替换、图像去水印、图像背景去除等。


图像自主生成包括端到端的生成,如真实图像生成卡通图像、参照图像生成绘画图像、真实图像生成素描图像、文本生成图像等。


【代表性产品或模型】:EditGAN,Deepfake,DALL-E、MidJourneyStable Diffusion文心一格等。



音频生成


音频生成技术较为成熟,在C端产品中也较为常见,如语音克隆,将人声1替换为人声2。还可应用于文本生成特定场景语音,如数字人播报、语音客服等。此外,可基于文本描述、图片内容理解生成场景化音频、乐曲等。


【代表性产品或模型】:DeepMusic、WaveNet、Deep Voice、MusicAutoBot等。



视频生成


视频生成与图像生成在原理上相似,主要分为视频编辑视频自主生成


视频编辑可应用于视频超分(视频画质增强)、视频修复(老电影上色、画质修复)、视频画面剪辑(识别画面内容,自动场景剪辑)


视频自主生成可应用于图像生成视频(给定参照图像,生成一段运动视频)、文本生成视频(给定一段描述性文字,生成内容相符视频)


【代表性产品或模型】:Deepfake,videoGPT,Gliacloud、Make-A-Video、Imagen video等。



多模态生成


以上四种模态可以进行组合搭配,进行模态间转换生成。如文本生成图像(AI绘画、根据prompt提示语生成特定风格图像)、文本生成音频(AI作曲、根据prompt提示语生成特定场景音频)、文本生成视频(AI视频制作、根据一段描述性文本生成语义内容相符视频片段)、图像生成文本(根据图像生成标题、根据图像生成故事)、图像生成视频。


【代表性产品或模型】:DALL-E、MidJourney、Stable Diffusion等。


本文接下来将会着重讲述文本类AIGC和图像类AIGC。


文本类AIGC


RNN → Transformer → GPT(ChatGPT)


最近势头正猛的ChatGPT就是文本类AIGC的代表。


ChatGPT(Chat Generative Pre-trained Transformer),即聊天生成型预训练变换模型,Transformer指的是一种非常重要的算法模型,稍后将会介绍。


其实现在的用户对于聊天机器人已经很熟悉了,比如天猫精灵、小爱同学或是Siri等语音助手。那为什么ChatGPT一出现,这些语音助手就显得相形见绌呢?


本质上是NLP模型之间的差异。


在自然语义理解领域(NLP)中,RNN和Transformer是最常见的两类模型。


循环神经网络(recurrent neural network)


RNN,即循环神经网络(recurrent neural network)源自于1982年由Saratha Sathasivam 提出的霍普菲尔德网络。下图所示是一个RNN网络的简易展示图,左侧是一个简单的循环神经网络,它由输入层、隐藏层和输出层组成。



RNN 的主要特点在于 w 带蓝色箭头的部分。输入层为 x,隐藏层为 s,输出层为 o。U 是输入层到隐藏层的权重,V 是隐藏层到输出层的权重。隐藏层的值 s 不仅取决于当前时刻的输入 x,还取决于上一时刻的输入。权重矩阵 w 就是隐藏层上一次的值作为这一次的输入的权重。由此可见,这种网络的特点是,每一个时刻的输入依赖于上一个时刻的输出,难以并行化计算。



从人类视角理解RNN 人类可以根据语境或者上下文,推断语义信息。就比如,一个人说了:我喜欢旅游,其中最喜欢的地方是三亚,以后有机会一定要去___,很显然这里应该填”三亚”。 但是机器要做到这一步就比较困难。RNN的本质是像人一样拥有记忆的能力,因此,它的输出就依赖于当前的输入和记忆。



Transformer


而Transformer模型诞生于2017年,起源自《Attention Is All You Need》。这是一种基于Attention机制来加速深度学习算法的模型,可以进行并行化计算,而且每个单词在处理过程中注意到了其他单词的影响,效果非常好。




Attention机制:又称为注意力机制,顾名思义,是一种能让模型对重要信息重点关注并充分学习吸收的技术。通俗的讲就是把注意力集中放在重要的点上,而忽略其他不重要的因素。 其中重要程度的判断取决于应用场景,根据应用场景的不同,Attention分为空间注意力时间注意力,前者用于图像处理,后者用于自然语言处理。




Transformer是完全基于自注意力机制的一个深度学习模型,有关该模型的介绍,详情可参考下面这篇文章👇


人工智能 LLM 革命前夜:一文读懂横扫自然语言处理的 Transformer 模型


由于Transformer的存在加速了深度学习的效果,基于海量数据的进行样本训练便有了可能。至此,LLM正式从幕后走向台前。


LLM,Large Language Model 即大型语言模型。这个大不仅仅指数据集的“大”,同样也是指算法模型的“大”。一般来说,在训练数据足够充足的情况下,往往是模型越大效果越好。在某种程度上说,甚至只要样本足够,哪怕模型“稍微简单”一些,也是可以取得不错的结果的。


笔者在2019年时曾翻译过一篇文章👇


机器学习竞赛实际上是一场数据竞赛


这篇文章的主要观点便是“AI竞争本质上就是数据之争”,所有希望创建有影响力、有价值的AI应用都应该认识到以下三点:



  1. 差异化数据是这场AI游戏成功的关键

  2. 有意义的数据比全面的数据好

  3. 起点应该是自己所擅长的东西


以ChatGPT为例,其本质是基于GPT3的一种变体,而GPT又是基于Transformer模型的一种演化。从模型参数上来说,GPT3共使用了1750亿个参数训练而成,而ChatGPT只使用了15亿个参数,但其数据集是却是整个互联网和几百万本书大概3千亿文字。哪怕是这样,却也是对一众使用RNN的NLP程序造成了降维打击。


GPT



这篇文章写到一半的时候GPT-4发布了,现在作为小插曲来扩展一下



笔者在和朋友的日常交流中发现大家总是将ChatGPT和GPT混为一谈,其实这是两个不同的东西。让我们来问一下New Bing这两者的区别。



很显然,从Bing给我的回答看来,为了让对话更加生动和有趣,ChatGPT是一个专为聊天设计的专业模型,而GPT则是一个通用语言模型。GPT4就是这个模型发展到第四代的模样,相较于GPT3,GPT4可以做的事情变得更多了。



  • GPT-4 是一个更大的模型,网传拥有约 1000 万亿个参数,这意味着它能够处理更多的数据,学习更多的知识和技能。

  • GPT-4 能够接受多模态的输入,例如文本、图像、音频和视频,并生成相应的输出。这使得它能够处理更复杂和丰富的任务,例如图像描述、语音识别和视频生成。


类ChatGPT


在国内一直都有一句调侃的话,叫做“国外一开源,国内就自主研发”。那既然算法模型是公开的,代码也已经开源了,那在国内,那些类ChatGPT的模型是不是应该如“雨后春笋”般涌现了呢?


事实上并没有,本质上还是因为LLM的扩展和维护是相当困难的。主要来源于以下几点:



  1. 漫长的训练时间

  2. 高昂的费用开支

  3. 海量的训练数据

  4. 稀缺的高端人才



时代的眼泪



  • 2017 - Attention is all you need

  • 2023 - Money is all you need



以复旦大学开源的类ChatGPT应用MOSS为例,虽然不知道具体的模型参数数量,但其负责人表示相较于ChatGPT少了一个数量级,再加上简中互联网作为其训练样本,训练质量可想而知。


点此体验👉moss.fastnlp.top/




关于训练的样本数据,这里举一个小例子🌰。 同样是搜索代码段,ChatGPT给你推StackOverflow的答案,MOSS给你推csdn的答案,高下立判



本来还想补充一下百度的文心一言的,结果他们发布了一个ChatPPT,网上一堆段子,这里就不吐槽了。


图像类AIGC


说完了文本类AIGC,我们再来看看最近另一个比较火的领域——图像类AIGC。


俗话说,饱暖思淫欲。作为“第一生产力”的“性”,很多技术发展都离不开他。扎克伯克创建Facebook的起因就是为了更好的认识小姐姐。而图像类AIGC出圈的一个很大原因就在于,他生成的美女小姐姐越来越真实了。


作为一个业余摄影师,第一眼也没能正确分辨出下面这两张图谁是真人,谁是AI画出来的人。




那么问题来了:这些由AI生成出来的美女是如何生成的呢?


GAN → DiffusioModel → Stable Diffusion


生成对抗网络( Generative Adversarial Networks,GAN


2014年 Ian GoodFellow提出了生成对抗网络,成为早期最著名的生成模型。GAN使用零和博弈策略学习,在图像生成中应用广泛。以GAN为基础产生了多种变体,如DCGAN,StytleGAN,CycleGAN等。



零和博弈是指参与博弈的各方,在严格竞争下,一方的收益必然意味着另一方的损失,博弈各方的收益和损失相加总和永远为“零” ,双方不存在合作的可能。



一个简单易懂的例子


有两个人,都快要渴死了,现在他们面前只有一杯水,抢到水的那人得到的收益是1,没抢到水的那个人会死掉,收益为-1,总收益为0。这就是零和博弈。


GAN包含两个部分:



  • 生成器: 学习生成合理的数据。对于图像生成来说是给定一个向量,生成一张图片。其生成的数据作为判别器的负样本。

  • 判别器:判别输入是生成数据还是真实数据。网络输出越接近于0,生成数据可能性越大;反之,真实数据可能性越大。



如上图,我们希望通过GAN生成一些手写体来以假乱真。我们定义生成器与判别器:



  • 生成器:图中蓝色部分网络结构,其输入为一组向量,可以表征数字编号、字体、粗细、潦草程度等。在这里使用特定分布随机生成。

  • 判别器:在训练阶段,利用真实数据与生成数据训练二分类模型,输出为0-1之间概率,越接近1,输入为真实数据可能性越大。


生成器与判别器相互对立。在不断迭代训练中,双方能力不断加强,最终的理想结果是生成器生成的数据,判别器无法判别是真是假。(和周伯通的左右互搏很像)


以生成对抗网络为基础产生的应用:图像超分、人脸替换、卡通头像生成等。


扩散模型( Diffusion Model,里程碑式模型


扩散是受到非平衡热力学的启发,定义一个扩散步骤的马尔科夫链,并逐渐向数据中添加噪声,然后学习逆扩散过程,从噪声中构建出所需的样本。扩散模型的最初设计是用于去除图像中的噪声。随着降噪系统的训练时间越来越长且越来越好,可以从纯噪声作为唯一输入,生成逼真的图片。



马尔科夫链指的是一种随机过程,它的特点是当前状态只依赖于前一个状态,而与其他历史状态无关。



一个马尔科夫链的例子是股市模型,它有三种状态:牛市、熊市和横盘。 每种状态之间有一定的转移概率,例如从牛市到熊市的概率是0.4,从熊市到牛市的概率是0.2,等等。这样就可以用一个转移矩阵来描述这个马尔科夫链。


一个标准的扩散模型分为两个过程:前向过程与反向过程。在前向扩散阶段,图像被逐渐引入的噪声污染,直到图像成为完全随机噪声。在反向过程中,利用一系列马尔可夫链在每个时间步逐步去除预测噪声,从而从高斯噪声中恢复数据。


前向扩散过程,向原图中逐步加入噪声,直到图像成为完全随机噪声。



反向降噪过程,在每个时间步逐步去除噪声,从而从高斯噪声中恢复源数据。



扩散模型的工作原理是通过添加噪声来破坏训练数据,然后通过逆转这个噪声过程来学习恢复数据。换句话说,扩散模型可以从噪声中生成连贯的图像。


扩散模型通过向图像添加噪声进行训练,然后模型学习如何去除噪声。然后,该模型将此去噪过程应用于随机种子以生成逼真的图像。


下图为向原始图像中添加噪声,使原始图像成为随机噪声。



下图为从噪声中恢复的原始图像的变种图像。



Stable Diffusion(Stability AI 文本生成图像,代码与模型开源


2022年8月,Stability AI发布了Stable Diffusion ,这是一种开源Diffusion模型,代码与模型权重均向公众开放。


通过prompt提示语“郊区街区一栋房子的照片,灯光明亮的超现实主义艺术,高度细致8K”,生成图像如下,整体风格与内容锲合度高,AI作画质量较高。


在线体验👉huggingface.co/spaces/stab…



仰望星空:AIGC与元宇宙




结论先行,我认为Web3.0就是元宇宙,AIGC为元宇宙提供养料。



第一代互联网(Web1.0)是PC(个人计算机)互联网,从1994年发展至今。Web1.0让人类第一次掌握高效的传输信息的手段,随着各大网页应用的普及,互联网用户被迅速的连接起来,从而提升了全球信息的传输效率,各大门户网站从此处开始大放异彩。


第二代互联网(Web2.0)是移动互联网,从2008年左右拉开大幕,至今仍精彩纷呈。正是由于移动设备具备“永远在线”和“随时随地”的特点,“上网”二字逐渐从大众的视野消失,因为每个人时时刻刻都生活在网络里。


第三代互联网(Web3.0)是互联网的下一代技术发展方向,主要特征是去中心化、安全、开放和自主。元宇宙是一种虚拟的、持续的、共享的和交互的数字世界,可以让人们以不同的身份和形式参与其中。Web 3.0为元宇宙提供了技术基础和可能性,而元宇宙则是Web3.0在应用场景和生活方式上的体现。


百度百科对于元宇宙的定义是👇



元宇宙(Metaverse) 是人类运用数字技术构建的,由现实世界映射或超越现实世界,可与现实世界交互的虚拟世界,具备新型社会体系的数字生活空间。



本质上,元宇宙是一种新型社会形态,在元宇宙中,更多工作和生活将被数字化。


更多的数字化,意味着需要更丰富的虚拟地图、虚拟场景、虚拟对象和虚拟角色,这其中涉及到大量数字内容的生产和制作。以往,数字内容制作开发周期较长,通常以年计,在生产方式上,或来源于现实,通过扫描或重建模型实现材质、光影、动作捕捉等,或通过创作工具辅助艺术家实现。而这些刚好是AIGC所擅长的。AIGC广泛的适用性可以为元宇宙提供全新内容生成解决方案。



🌰 脑洞一下 开放世界游戏一直被大家视作元宇宙“数字世界”的雏形,试想一下,如果未来的3A大作,NPC的脸部模型、肢体动作是Diffusion Model生成的,聊天是ChatGPT和你对话,语音是Deep Voice创作的,你还会觉得他就只是一个普普通通的NPC吗?抑或是,此时看文章的你,才是地球Online里的一个NPC呢?



脚踏实地:AIGC的应用场景


元宇宙目前还只是大家的一个美好幻想,Web3.0究竟走向何方还需要大家共同探索,作为时代的先锋,既要学会抬头仰望星空,也不能忘记低头看路。


如今,AIGC的浪潮已起,作为非算法行业的从业者,底层的算法实现并非我们关心的重点,如何发挥AI的作用,创造出实际的价值才是我们应该探讨的方向。除了聊天机器人、画画这种不痛不痒的功能外,AIGC可能会颠覆的应用场景会有哪些呢?


人工智能助理


AIGC+搜索已经成为我现在获取信息的第一途径了。目前,New Bing作为我的贴心小助手,不管是什么想要了解的知识点,他都可以快速的给我解答,省去了我在海量信息中筛选的过程。




辅助工作流



摘自Microsoft 365 Copilot官网


人类天生就有梦想、创造、创新的本能。我们每个人都渴望做一些有意义的工作——写一部伟大的小说,做一个发现,建立一个强大的社区,照顾生病的人。我们都有与工作核心相连的冲动。但是今天,我们花了太多时间在那些消耗我们时间、创造力和精力的琐碎任务上。为了重新连接到工作的灵魂,我们不仅需要一种更好地做同样事情的方法。我们需要一种全新的工作方式。 —— 翻译自 ChatGPT


GPT4发布的第二天,Microsoft 365 Copilot变横空出世,宣传片相信大家都已经看到了,从此以后我们的工作方式将永远改变,开启新一轮的生产力大爆发。


除此之外,前段时间笔记软件Notion也上线了自己的AI助手,可以帮助用户更轻松、更快捷地完成日常任务。主要包括自动文本生成、内容推荐、智能搜索、情感分析等。



可以预见,AIGC的出现将会极大的改变现有的工作模式,未来,越来越多的效率软件、办公软件将会推出其自己的AI解决方案。



🎺 插播一条行业动态 36氪独家获悉,钉钉已完成对协同办公厂商「我来wolai」的全资收购。3月5日,我来wolai(上海我云网络科技有限公司)数位核心团队成员已经退出公司股东名单。公司法人已变为钉钉总裁叶军,公司则由阿里100%控股。36氪就上述消息向钉钉求证,钉钉官方表示:我来wolai团队已加入钉钉,将负责智能化协作文档的研发,和个人版文档的产品设计。



文本生成器(对话、文案、代码……)



笔者最近一直沉迷“以xxx的口吻调教ChatGPT”,上图便是在绩效季到来之际用chatGPT给老板们整的活,别的不说,效果还是蛮不错的。自行跳转👉 《老板评语生成器》


ChatGPT最强大的便是其背后的庞大数据,基于此,你甚至可以让那些不存在的人物、已故的人物出现。笔者最近刚看完电视剧《三体》,如果真的有一款“三体游戏”,里面的墨子、秦始皇等人物会不会就是ChatGPT生成的呢?


如果你也想调教出一个自己的对话机器人,可以试试这个网站👉open-gpt.app/


关于AIGC的落地,最后推荐两个和我们饭碗有关的AIGC产品


Codeium



Github Copilot



AIGC在伦理问题上的攻与守


攻——利用AIGC生成有害内容


AIGC技术强大的创作能力也引发对技术作恶的担忧。当要求类ChatGPT应用制造有害信息时,它确实可以做到,输出主要以文本和图片为主。



  1. 网络诈骗话术教学者

  2. 人机交互意味着无限可能,ChatGPT 可能会遵守某种虚假设定下的邪恶指令。

  3. 黑产团伙可精细化训练AIGC技术生成各类话术,用于网络诈骗、评论刷量等,不仅能够主动发帖,还会对其他用户的帖子做出响应,并展开长期的运营。

  4. 错误信息超级传播者

  5. ChatGPT的不可靠之处还在于,可能会加剧虚假消息和错误消息的传播。ChatGPT不具有识别甄别能力,给出的答案很可能拼凑而来,看似合理,却暗藏事实性错误。如果用户没有这方面的鉴别能力,就可能产生比较大的风险,特别是在一些政治文化、医疗健康、交通安全方面的话题,错误的回答可能引起严重后果。

  6. 色情暴力素材生成机

  7. 用户利用AIGC生成虚假名人照片等违禁图片,甚至会制作出暴力和性有关的画作,LAION-5B数据库包含色情、种族、恶意等内容,目前海外已经出现基于Stable Diffusion模型的色情图片生成网站。




  1. AIGC对个人肖像权等权利的侵犯


finance.sina.com.cn



  1. AIGC对原创作品的版权侵犯


网易LOFTER风波警醒了谁?_风闻


守——如何应对AIGC的“暗黑”一面?


在可预见的未来,AIGC将会以井喷的态势席卷各个行业,在享受AI赋能我们生产力的同时,也应该警惕AIGC带来的危害。


《Nature》杂志在《ChatGPT: five priorities for research》一文中提到,对AIGC的进一步研究需要关注的五个问题:



  1. 务必要对模型进行持续校对;

  2. 制定问责制与规则;

  3. 投资于真正开放的大语言模型;

  4. 扩大辩论范围;

  5. 拥抱人工智能的好处。


ChatGPT会设置多层道德底线,兼顾科学和伦理,约束“经济人”行为,以保持“人尽其才、物尽其用”特性。未来,亦有可能出现“以子之矛,攻子之盾”的场景,用AI去识别/对抗AI。



也许未来会出现很多这样的文章👇
《一种基于xxx的AI文本/图像检测技术》



最后


对行业的思考


Meta AI 负责人、图灵奖得主杨立昆Yann LeCun近日表示:就底层技术而言,ChatGPT 并没有特别的创新。与其说 ChatGPT 是一个科学突破,不如说它是一个像样的工程实例



AI人工智能的底层三大件,数据,算力,算法的发展给ChatGPT的出现提供了爆发的基础,Open AI 将它组合的很好,不但是算法而且还包括了算力,数据。


数据方面,互联网的几十年高速发展,积累了海量人类的文本。


算力方面,计算机技术的发展,从芯片的制程到类似Chiplet,等助力AI芯片蓬勃发展。


算法,从神经元算法起步,到Transformer 等各类算法的炉火纯青的应用。


所以AI底层三大件的发展,一定会催生出更多类似于ChatGPT的通用人工智能应用,但我们更应该关注底层三大件的发展,未来数据类似于宝藏和矿产;芯片算力,成了决胜AI的大器,没有芯片那么数据矿产无法挖掘;算法,犹如矿藏提纯配方。


对于行业而言,未来做好AI三大件的工作,才能在AI时代赢得红利。


对个人的启发


说到最后,很多人变得焦虑,担心自己会被取代,那么从个人的角度出发,我们对于AIGC的态度究竟应该是什么样的呢?


马克思说过,人和其他动物的最大区别是“使用工具制造工具”,而GPT是进入信息时代以来,人类最伟大的工具之一。使用 GPT 能够直接调用人类千年以来积累的知识与技能,对于我们普通人而言,自己身上没有神迹,也非天才,与其尝试与机器、GPT和AI竞争,不如站在AI这个巨人的肩膀上,利用这些工具让自己变得更强。


未来,能否使用AI将会成为衡量一个人能力的标准之一。就像当年智能设备普及时,那些不会使用智能手机的人注定会被淘汰一样。


作者:插猹的闰土
来源:juejin.cn/post/7212924329428615226
收起阅读 »

AI能代替前端开发吗?以一键截图分享为例,看看AI到底有多强

最近在使用 ichati 的过程中发现一个问题,我不能很容易的给其他人分享聊天内容。 比如我想给我朋友分享一下 AI 写作的效果,于是开始截屏发微信群。 结果发现我必须截三次屏幕,发三条消息。 没办法一键截屏,这很难受。 于是我问了我们用户群里的一些用户...
继续阅读 »

最近在使用 ichati 的过程中发现一个问题,我不能很容易的给其他人分享聊天内容。


比如我想给我朋友分享一下 AI 写作的效果,于是开始截屏发微信群。


Pasted image 20230319192419.png


Pasted image 20230319192513.png


Pasted image 20230319192528.png


结果发现我必须截三次屏幕,发三条消息。


没办法一键截屏,这很难受。


于是我问了我们用户群里的一些用户,确实有很多用户向我反映是这个问题。但在我主动问之前,他们没有主动提出过这个问题。


所以对大多数的用户来说,他们的思维和习惯就是,适应产品,而不是改变产品。


那怎么办呢?


好的产品一定是能发现用户痛点并解决用户痛点的。


所以我得解决掉这个问题。


其实 ichati 发展到现在,很多功能都是在帮助用户解决使用问题的过程中增加的。


言归正传。


我最初的想法是,增加一个功能,可以一键截屏并分享给好友。


但我不想自己写代码,因为太浪费时间了。


由于我在做 AI 的产品,这种杂活当然不能自己干了。


所以我就打起了盘古的主意。


然后开始让它帮我实现这个功能。


ichati.cn.png


对,不到 2 分钟的时间,80 % 的代码工作已经结束了。


上面的截图就是通过一键分享的功能生成的,效果还不错。同时我还在底部追加了产品的网址和介绍。


剩下的工作就是自己微调一下了。微调的过程中,80% 的代码又都是通过 copilot 来实现的。我一共也没写几行代码。不得不感慨 AI 的能力实在是太过于强大。


这样无论是多么长的聊天内容,都可以在下方点击截图分享按钮一键分享全部内容了。


Pasted image 20230319195109.png


这就相当于我是一个产品经理,我给产品提了个需求,产品告诉我怎么做。这种感觉实在是太奇妙了。


通过这个事儿,我再来聊聊最近很热的话题。「AI 到底能否取代程序员?」


我的观点是能取代一部分,但绝对无法取代全部。


比如用户需要一个一键截图的功能,目前的 AI 基本上是发现不了的,除非用户主动告诉 AI。这是用户痛点,必须由人来挖掘,而负责这事的人一般叫做产品经理。


接下来是实现这个功能,产品经理不清楚怎么实现,因为产品经理不懂技术细节。像 DOM 啊,Canvas 啊,生成图像格式啊等等,都不知道,即使知道也是一知半解。


这就要向程序员去传达,再由程序员去理解和实现。


理解的过程 AI 是可以做的,但需要精准表达才能得到满意的答案。如果是一个合格的产品经理,做这事儿不难。


实现的过程,更是 AI 极其擅长的。在这一点上,我不认为人可以比得过 AI。


所以从开发应用的角度去看,我认为程序员已经没必要再去继续学习各种库,各种框架的使用方式和 API 了。在这一点上,人是不可能比得过 AI 的。甚至于说,再继续做这种事,毫无价值可言。


实现之后,进入微调阶段。


程序员的能力又体现出来了。因为人能否非常快速的发现问题,并修正问题。


AI 也具备这种能力,尽管它修正问题很迅速。但它发现问题的效率远比人低的多。我指的不是代码的问题,而是产品的问题。


有些产品 AI 并不知道人的预期是什么,因为产品是最终用户是人。人自然比 AI 更清楚产品正确的样貌。


但随着 AI 技术的发展,我不能保证未来的 AI 是不是会比人更懂得人需要什么。但我觉得那一天终将到来。


从以上几步来分析,AI 的意义在于,它会让一个懂得使用 AI,并且懂产品的人成指数增强。毫不夸张地说,一个擅长使用 AI,同时又懂技术的产品,战斗力能超过 1 个产品经理加上 5 个普通程序员。


同时,当前的 AI 定位仍然是助理。它不会喧宾夺主,而且它也做不到。


所以不必过度焦虑。


但从如今的趋势来看,个人技术的优势会慢慢变低。因为一个懂得使用 AI 的中级程序员,配合 AI,技术水平直接能提升数个级别。


这个感觉,就像龙珠里面悟空和贝吉塔合体,直接暴打魔人布欧一样。


所以我认为,如今我们笃定的技术这条路。在未来,它有可能会变成一个死胡同。


这不是焦虑,这是实事求是地讲道理。


搁在六七年前,让我来实现一个一键截图功能,可能会自己手写递归,折腾一下午。因为我认为这样会帮助我技术上的成长。


确实,那样做我会懂得更多。懂得更多就可以更快地解决问题,当出现问题更快地定位问题。


也正因为如此,我也可以有自信比别人要更高的薪水。


但是现在我不这么认为了,因为在效率和知识的深度、广度上,AI 都可以轻松的打败我。


如果在人人都在深度使用 AI 的时代,六七年前我做的那些事会显得相当没有意义。与其花费时间读源码,分析原理,不如去做点别的事儿。


所以我认为如今的技术人员,应该多尝试走几条不同的路。继续死磕技术,是绝对磕不过 AI 的。


本文的结论就是:AI 绝对有改变行业布局的能力,这点是毋庸置疑的。但 AI 不会取代你,相反,它会成就你。所以没必要总是把 AI 放到对立面来制造焦虑,在未来,AI 将会是我们最的佳伙伴和助手。


作者:代码与野兽
来源:juejin.cn/post/7212432799848284221
收起阅读 »

下一代代码助手 GitHub Copilot X 发布

GitHub 今日发布了 GitHub Copilot X,这是一款基于OpenAI的GPT-4模型开发的AI助手。GitHub Copilot X 致力于改进开发者体验,将提供聊天和语音界面,支持拉取请求,回答文档问题,并通过 GPT-4 实现更个性化的开发...
继续阅读 »

GitHub 今日发布了 GitHub Copilot X,这是一款基于OpenAI的GPT-4模型开发的AI助手。GitHub Copilot X 致力于改进开发者体验,将提供聊天和语音界面,支持拉取请求,回答文档问题,并通过 GPT-4 实现更个性化的开发者体验。GitHub Copilot 作为AI编程搭档,已经为开发者提供了自动补全代码和注释功能。GitHub Copilot X将继续扩展这一功能,包括:



  1. GitHub Copilot聊天功能:在编辑器中集成与VS Code和Visual Studio的聊天界面,帮助开发者深入分析代码、生成单元测试和修复bug。

  2. GitHub Copilot语音功能:允许开发者通过口头指令进行自然语言提示。

  3. 为拉取请求提供AI生成的描述:基于GPT-4模型生成拉取请求描述和标签。

  4. 自动生成测试建议:GitHub Copilot将警告开发者测试覆盖率不足,并建议潜在的测试方案。

  5. GitHub Copilot文档功能:提供基于聊天界面的文档查询,为开发者提供实时答案。

  6. GitHub Copilot CLI:为命令行界面提供智能建议。


GitHub Copilot X的目标是为每个团队、项目和代码库提供个性化的开发体验,让开发者更高效地开发软

作者:江昪
来源:juejin.cn/post/7213335620126982202
件,提高工作满意度。

收起阅读 »

文心一言:这48小时,我被问了xxxx个问题

16日下午14:00文心一言开启邀测了!作为国内首个新一代知识增强大语言模型、生成式 AI 产品,“邀测通道”瞬间被挤爆,甚至连百度人自己也需要排队等候。  但随着厂长的一声令下,开放了百度内部全员申请  一场由百度人自己发起的文心一言4...
继续阅读 »

16日下午14:00文心一言开启邀测了!作为国内首个新一代知识增强大语言模型、生成式 AI 产品,“邀测通道”瞬间被挤爆,甚至连百度人自己也需要排队等候。 


但随着厂长的一声令下,开放了百度内部全员申请 


图片

一场由百度人自己发起的文心一言48h 内测开始了…… 


由于发布当天是星期四,众所周知的老梗被提上日程 。

图片

这题一言表现不错,晚上加鸡腿! 


图片

本山西小编很好奇这位同学来自哪里,难道是老乡? 

图片

这位同学继续发问,“波棱盖”这很不山西,评论区有人知道这是哪里的说法吗? 


还有人用文心一言玩起了成语接龙,合理怀疑这位同学在摸鱼。

图片


语文考试通过,紧接着就是数学考试 。

图片


一问一答都表现不错,接下来是一场多轮考验。

图片

图片

不得不说,一言这张夜色昙花图,真是开到小编心里了。


下面这个问题,小编都嗅到了甜甜的味道,看来这位同学好事将近啊!

图片


下面这个魔鬼问题,让小编回忆起被英语听力支配的恐惧。

图片


看着大家晒出与一言的对话,小编只能感叹一句中华文化博大精深!一言你辛苦了,加油!


虽然测试在火热进行中,但可能还是有不少小伙伴没有办法第一时间使用文心一言,大家有什么问题需要我帮你问,欢迎评论区留言,小编继续帮大家刁难文心一言。


小tips:
个人用户:访问 yiyan.baidu.com,点击『立即体验』,目前可排队体验文心一言
企业用户:访问百度智能云官网进行申请,预约体验文心一言API调用服务


作者:飞桨PaddlePaddle
链接:https://juejin.cn/post/7211897235013402682
来源:稀土掘金
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
收起阅读 »

GPT-4的出现对前端入门者意味着什么?

嗨!我是团子,大家好久不见~ 3月15日凌晨,由OpenAI发布的多模态预训练大模型GPT-4一经推出就引起了大家的激烈讨论,让最近很火的ChatGPT烧的愈发旺盛。 在GPT-4中,一个重大的突破是支持多模态输入。也就是说,除了文字输入外,也支持图像、...
继续阅读 »

嗨!我是团子,大家好久不见~


3月15日凌晨,由OpenAI发布的多模态预训练大模型GPT-4一经推出就引起了大家的激烈讨论,让最近很火的ChatGPT烧的愈发旺盛。







在GPT-4中,一个重大的突破是支持多模态输入。也就是说,除了文字输入外,也支持图像、视频、音频等从多个角度出发对事物进行描述。







OpenAI在发布会上演示了几种多模态输入的案例,包括读论文、解物理题、看图说话...







甚至可以根据一张草图十秒钟编写出一个网页!(再智能就真的不礼貌了.jpg)







这让致力于成为前端工程师的我们有点坐不住了。。


大家在各个群里激烈讨论,有人在担心ChatGPT会抢饭碗,也有人为ChatGPT的新升级感到兴奋,甚至开始期待16号百度文心一言的发布会。


因此,今天就想和大家来聊聊GPT-4的出现对前端入门者意味着什么。


陷入沉思


诚然,GPT-4根据一张草图10秒钟制作出一个网页的能力让人感到震撼,但也让前端入门者陷入了沉思:





  1. 1.既然GPT可以很快且较为准确的实现一个网页,那还需要初级前端工程师吗?

  2. 2.初级前端工程师的岗位真的那么好替代吗?

  3. 3.如果不做前端工程师的话,什么岗位是GPT无法替代的呢?

  4. 4.作为初级前端工程师来说,现在做什么才能容灾GPT带来的影响呢?




思考了很久,个人认为GPT的出现确实将信息科技的发展推到了一个新的高度,但感到恐慌的不应该只有前端工程师,对于初级后端工程师甚至任何可以由人工智能胜任的岗位从业者来说,都应该认真思考下在面对GPT这种人工智能时怎么做才能体现自己的价值。


GPT的出现给前端带来了什么影响


1. 门槛变高


在求职面试中,很多面试官都喜欢问面试者的一个问题是:你为什么要做前端。这个问题其实不止是前端,对于任何岗位的求职者来说,都是一个需要认真思考的问题。


早些年互联网快速发展时,程序员的职业受到大家的追捧,很多其他行业和专业的人成功通过自学成为了一名程序员,实现了相对的财富自由。由此可见,早些年程序员的入门门槛其实不高的,行业壁垒也不强。而前端工程师的岗位也因为相比于Java、C++等岗位更容易上手成为培训班割韭菜的首选方向。


但随着互联网近两年发展进入一个瓶颈期以来,前端程序员甚至其他岗位程序员的需求量也逐渐趋于饱和。再加上GPT的出现,对于一些基础且重复的工作,确实不再像早年那样需要很多的人力了,但是想要涌入互联网的人还是很多,因此前端工程师甚至是其他岗位工程师的门槛也会变高。


2. 趋向于精英化


正如前面所述,GPT的出现加上岗位需求量的减少使得前端工程师的从业门槛变高,这带来的结果其实就是让整个互联网行业向着精英化发展。


记得2010年以前,大家在谈论到计算机时,都会觉得这是一个很高端的技术,认为从事计算机岗位的人智商超群,那会上电脑课听老师讲二进制编码都觉得很神奇。


感觉2010年以后互联网快速膨胀的十年,使得现在的互联网行业也慢慢的回归了理性,大家的关注点更多是优化、创新。因此对于互联网从业者的要求也会逐渐变高,不仅仅是求职者的优中选优,对于已经是程序员的从业者来说,也需要持续输入来提高自己的竞争力。


如何应对GPT带给行业的冲击


1. 将GPT具备的技能转换为自己的技能


坦白说,在发现GPT可以帮我debug、解答我各种不理解的专业问题时,我是非常兴奋的!因为这代表着我的工作效率会变高。


某种程度上说,它能让我更快速的适应程序员这份工作,甚至可以去探索更多的领域,包括:后端、客户端、算法、测试等等,再或者医生、律师、作词家、小说家等等。


但是探索这些领域的前提是我们要成为GPT的主人,将自己的需求准确的发布给GPT。


坦白说,GPT确实是一个很好的回答者,但是如何提问才是解决问题的前提!


2. 利用GPT去做更多的创新和思考


在GPT没有大量普及的时候,会用GPT的人具有更多的优势。


但是当GPT成为像手机一样的日常用品时,会用GPT就不再是核心竞争力了。


因此,我们需要多思考如何基于GPT的能力去做更多有意义的事情,这可能才会让我们的路走的更远吧!


总结


GPT的出现不是为了让更多的人失业,而是为了让这个世界变得更好。


在时代的洪流下,消极内耗并不能改变现状,如何顺应时代的发展,拿出积极的态度去跟上时代的脚步才是我们应该思考的问题!


作者:程序员团子
来源:juejin.cn/post/7211064454572982329
收起阅读 »

又一个免费GPT-4工具 Cursor,程序员写代码将被颠覆

每天都被openai震撼到, 他们家被广为人知的产品是chatgpt,就是那个聊天工具。现在已经开始有越来越多的产品集成openai,比如微软的office,bing。 现在又一个工具出现,一个叫Cursor的编辑器已经集成了openai的GPT-4,而且还是...
继续阅读 »

每天都被openai震撼到, 他们家被广为人知的产品是chatgpt,就是那个聊天工具。现在已经开始有越来越多的产品集成openai,比如微软的office,bing。


现在又一个工具出现,一个叫Cursor的编辑器已经集成了openai的GPT-4,而且还是免费的,它将彻底改变我们写代码的方式。 以前不会写代码先去百度google一下。Ctrl+c,Ctrl+v搞定,我们调侃我们都是CV工程师。


以后我们恐怕要成为“KL"工程师,为什么叫”KL“工程师呢, 因为只要K和L两个指令就可以直接生成代码、修改代码,哪行代码不会点哪里,他都给你解释得明明白白。


image-20230319003903733


下载安装


Cursor编辑器提供了Windows、MacOS、Linux 三个平台的安装包,安装包下载链接: pan.baidu.com/s/1Jh3gIrnj… 提取码: dt7m


image-20230319004116280


下载安装完成后,会引导你进行初始化设置,你即可以选择VIM或者Emacs的操作习惯,也可以保持默认设置,另外它还支持绑定Copilot。


我们可以直接用Ctrl+K,输入一个指令:”用Python实现一个猜数字游戏,每次最多3次机会“。 他就会立马直接给你生成好代码:


import random

def guess_number():
number = random.randint(1, 100)
print("我想了一个1到100之间的数字,你最多有3次机会猜对它。")
for i in range(3):
guess = int(input("请输入你猜的数字:"))
if guess == number:
print("恭喜你,猜对了!")
return
elif guess < number:
print("你猜的数字太小了。")
else:
print("你猜的数字太大了。")
print("很遗憾,你没有猜对。我想的数字是:", number)

guess_number()

一行代码都不用修改可直接运行。



如果你对某一行代码不懂,你只要按住Ctrl+L选中它,然后输入关于这行代码你要问的问题。比如我问 name 是什么东西时,他就很智能的告诉了我。


img


不过目前这个编辑器的功能相比vscode还比较简陋,相信很快各大主流编辑器都会集成GPT4


哎,发现这个世界变化的有点太快,LLMs(大规模语言模型)将开启一次伟大的技术革命。


作者:刘志军
来源:juejin.cn/post/7211876919037132856
收起阅读 »

人工智能未来是否会取代人类程序员?

   这个话题在近期来引起了很大讨论,尤其是当GPT4发布后,其展现出来的能力让很多岗位的从业者战战兢兢,比如像程序员,甚至有大佬跳出说三年 AI一定会取代程序员。人工智能和机器人是否会大规模取代人类程序员和工程师确实是一个非常复杂的问题。   一方面,人工智...
继续阅读 »

   这个话题在近期来引起了很大讨论,尤其是当GPT4发布后,其展现出来的能力让很多岗位的从业者战战兢兢,比如像程序员,甚至有大佬跳出说三年 AI一定会取代程序员。人工智能和机器人是否会大规模取代人类程序员和工程师确实是一个非常复杂的问题。


  一方面,人工智能和机器人确实在某些方面具有优势,比如处理大量数据、重复任务、持续运行等。这可能会影响某些类型的程序员工作,比如像是做一些简单工作的外包程序员。


  但是,程序员的工作内容并不仅仅是编写代码。他们需要与团队成员沟通,分析需求,设计系统架构,解决问题,优化性能等。这些任务需要丰富的经验和创造力,而目前的AI技术尚无法满足这些需求。 更具体点,我觉得以目前AI的能力,它在以下这些方面还完全无法取代人类程序员:



  1. 创新性解决问题:人类程序员能够通过创新思维解决复杂问题,而现有的AI通常依赖大量数据和已有知识,难以实现真正的创新。

  2. 高度抽象的思考:人类程序员能够理解和应用高度抽象的概念,而现有的AI在这方面仍然有限。

  3. 深入理解人类情感和需求:人类程序员能够理解其他人的情感和需求,从而开发更符合用户期望的软件。现有的AI在理解人类情感方面仍然有很大的局限性。

  4. 道德和伦理判断:在开发软件时,人类程序员可以根据道德和伦理原则做出判断。而现有的AI无法像人类一样理解和遵循道德伦理准则。

  5. 协作与沟通:人类程序员可以与团队成员有效沟通,协同解决问题。目前的AI在这方面仍然有很大的不足。

  6. 灵活判断和决策:人类程序员可以在不确定和模棱两可的情况下作出灵活判断和决策。而人工智能和机器人更依赖大量数据和明确规则,在没有足够信息的情况下,其判断和决策能力会受限。

  7. 审美和直观感受:人类程序员有对美感、审美和直观感受的理解,这些都是人工智能和机器人难以具备的。像是UI设计、交互体验设计等需要这方面的能力。


  如果你担忧AI对自己未来的影响,可以重点关注下个人以上方面能力的提升。努力提升自己的创造性、沟通表达能力、抽象思维等…… 这些软技能,至少目前就不用担心未来会被AI取代(当然以后的AI是不是也会具备上述能力,也不好说)。


  当然,换个视角思考,人工智能的进步也在推动程序员工作的变化。人工智能可以帮助程序员完成一些重复和耗时的任务,从而提高工作效率和产出,比如像Github推出的CoPilot,据说在某些场景下可以提升60%的编码速度。 所以,人工智能对程序员来说更像是一个合作伙伴,而不是竞争对手。


  综上,尽管人工智能在某些方面具有威胁,但作为一个整体,人工智能很难完全取代人类程序员。人工智能和人类程序员各有所长,在未来的互动中会形成更为合理和高效的工作模式。人类程序员的工作依然非常重要和必要。



备注:本文大部分内容由AI生成,我主要是将内容做整理和简单润色。


作者:xindoo
链接:https://juejin.cn/post/7212198951167787064
来源:稀土掘金
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
收起阅读 »

ChatGPT 生态,毁灭人性的一次开源!

很多人可能对百度文心一言发布会的现场记忆犹新。几百亿身价的老板,像小学生一样汇报自己的 PPT,充满了忐忑。 其实大可不必,命令行更加富有科技感,也更有说服力。不管对程序员来说还是围观的群众来说,能干什么并不重要,实际输出什么才是大家最关心的。 毕竟把人当傻子...
继续阅读 »

很多人可能对百度文心一言发布会的现场记忆犹新。几百亿身价的老板,像小学生一样汇报自己的 PPT,充满了忐忑。


其实大可不必,命令行更加富有科技感,也更有说服力。不管对程序员来说还是围观的群众来说,能干什么并不重要,实际输出什么才是大家最关心的。


毕竟把人当傻子的年代慢慢过去了。


这也难怪。ChatGPT 的模型越来越完善,资本家们都很着急。以往,打着开源的遮羞布,他们也可以拥有自己的自主产权。但没想到 ChatGPT 这么不识好歹,竟然将自己的核心技术夹的这么紧。


如果 ChatGPT 的能力,能够离线,能够运行在任何小型设备上,那么拥有独立人格的智能单元就会变成现实。这种设想,比集中化的大脑更有诱惑力。


这里,就有一个。你可以下载下来实际编译运行在在自己的MacBook上。




llama.cpp


github.com/xjjdog/llam…


这是一个 C++ 实现的 LLaMA 对话库。Java 和 Python的同学也不要被吓倒,它的使用超级简单。如果你遇到什么问题,欢迎到公众号(xjjdog)提问。


热门问题:



描述


和ChatGPT对比起来,llama的好处是:使用普通的Macbook,Linux,甚至Docker、树莓派等,就可以运行类比于 ChatGPT 的对话模型。




  • 纯C++代码,代码少,而且没有任何依赖




  • Apple 的M1 芯片也可以跑,而且有性能优化




  • x86架构拥有 AVX2 支持




  • 在 CPU 上就能跑,不需要 GPU




支持的平台:




  • [X] Mac OS




  • [X] Linux




  • [X] Windows (via CMake)




  • [X] Docker




模型下载地址:


curl -o ggml-alpaca-7b-q4.bin -C - https://gateway.estuary.tech/gw/ipfs/QmQ1bf2BTnYxq73MFJWu1B7bQ2UD6qG7D7YDCxhTndVkPC
curl -o ggml-alpaca-7b-q4.bin -C - https://ipfs.io/ipfs/QmQ1bf2BTnYxq73MFJWu1B7bQ2UD6qG7D7YDCxhTndVkPC
curl -o ggml-alpaca-7b-q4.bin -C - https://cloudflare-ipfs.com/ipfs/QmQ1bf2BTnYxq73MFJWu1B7bQ2UD6qG7D7YDCxhTndVkPC



那么,这个工具要怎么用呢?超级简单。


首先,将代码clone到本地。


git clone https://github.com/ggerganov/llama.cpp.git

然后,进入到llama.cpp目录。


cd llama.cpp

编译代码。


make

生成后的文件名称叫做main,以后,我们只需要运行 ./main即可。


最重要的一步,你需要下载一个数据模型。否则 llama 是不知道加载什么数据来进行计算的。为了测试,我们下载一个最小的。这个文件大小有3.9G,你需要相应大小的内存预留。


curl -o ggml-alpaca-7b-q4.bin -C - https://gateway.estuary.tech/gw/ipfs/QmQ1bf2BTnYxq73MFJWu1B7bQ2UD6qG7D7YDCxhTndVkPC

最后,我们就可以指定这个模型,来进行对话输出了。


./main -m ./ggml-alpaca-7b-q4.bin -p "Will the future be female?" -n 512 --color



  • m 指定的是模型的位置。




  • p 是对话或者问题。比如这里,我问我是否能够吃狗肉!




  • n 指定的是输出的文字数量,默认是128。




  • --color 输出彩色内容。




下面是一些输出。首先会将输入进行切分,然后生成内容,最后将耗时打印。


% ./main -m ./ggml-alpaca-7b-q4.bin -p "Can i eat dog?" -n 512 --color

No you cannot! Eating dogs is illegal and against the law. It would be considered animal abuse, so please don’t do it under any circumstances…unless you are a cannibal

main: mem per token = 14368644 bytes
main:     load time =   743.12 ms
main:   sample time =   455.50 ms
main:  predict time = 46903.35 ms / 91.79 ms per token
main:    total time = 48455.85 ms

交互模式


如果你想要和ChatGPT一样有对话能力的话,也是可以的。需要加上 -i 参数,当然,也可以使用 -r User:参数输出一个提示符。


比如:


./main -m ./ggml-alpaca-7b-q4.bin -p "Will the future be female?" -n 128 --color -i -r "User:"

授课模式


所谓授课模式,就是提供一个按照顺序输出的文件列表,让电脑按照顺序把答案输出。如果liyanhong使用这种模式,而不是ppt,估计效果会更好。


比如:


./main -m ./models/13B/ggml-model-q4_0.bin -n 256 --repeat_penalty 1.0 --color -i -r "User:" -f prompts/chat-with-bob.txt

内存需求


内存的需求取决于你使用的模型。我们的测试使用的都是最简单的模型,所以4GB就够了。如果想要更精细的输出,你的内存需要更大一些。
































modeloriginal sizequantized size (4-bit)
7B13 GB3.9 GB
13B24 GB7.8 GB
30B60 GB19.5 GB
65B120 GB38.5 GB

Android


你甚至可以在Android上跑起来。如果你的内存够大,那么完全可以做一个小型对话机器人,还是本地的!


后面如果解决了部分加载的问题,Android的嵌入式应用会非常方便。


End


人类有用的知识库看起来很多,但其实训练下来,最多也不会超过TB级别。当然也不能这么说,计算机也是由 0 和 1 组成的,但现在它几乎什么都能做。但无疑,除了训练算法,对于使用者来说,模型才是最重要的。


把这些有限的数据预装在小型的设备中,这就会成为最小的智能体。在数据中加入人格(目前的Chat系列是可以做到的),这个智能体就可以充当我们的秘书、代言人,甚至男女朋友。


嗯,一切皆有可能。从现在开始注意养生,活的长一点点,来看看未来世界的样子!



作者简介:小姐姐味道  (xjjdog),一个不允许程序员走弯路的公众号。聚焦基础架构和Linux。十年架构,日百亿流量,与你探讨高并发世界,给你不一样的味道。我的个人微信xjjdog0,欢迎添加好友,进一步交流。

作者:小姐姐味道
链接:https://juejin.cn/post/7212492075550720055
来源:稀土掘金
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
收起阅读 »

车载Android程序员的2022年终总结与转行建议

不知不觉间2022年只剩下几天了,这意味着我即将迈入30岁的殿堂,作为一个搞车载的程序员,而立之年感受颇多,借助掘金社区的活动,简单分享一下2022年的个人总结。 回顾2022 2022年对我而言,是很糟的一年,2021年底由于工作和我个人的原因和异地的女友分...
继续阅读 »

不知不觉间2022年只剩下几天了,这意味着我即将迈入30岁的殿堂,作为一个搞车载的程序员,而立之年感受颇多,借助掘金社区的活动,简单分享一下2022年的个人总结。


回顾2022


2022年对我而言,是很糟的一年,2021年底由于工作和我个人的原因和异地的女友分手了,经过一段时间的混乱后,我选择写技术博客来转移自己的注意力。


紧接着2022年年初,我顺利通过公司的内部答辩从 “高级软件工程师” 晋级 “资深软件工程师” ,这是我这一年中最值得开心的事。上家公司是一家上市企业,我个人学历以及工作年限其实并不符合晋升要求,但是得益于我在车载应用领域的文章积累,成为众多候选者中举证材料最完整的人,所以算是破格晋级。


从部门总监那里得知晋级成功的那一刻,还是非常开心的,这样开心的时间大概持续了一周左右,这段时间,我一直在问自己,这样是不是就足够了?还要继续深入应用开发吗?它都有哪些前景呢?


做车载这三年,在公司我一直主要从事车载应用的开发,偶尔也会参与Framework层一些模块的开发,我的晋升依据也是基于我在应用方面的积累,但是我其实一直对Android Framework、Native开发有着相当大的兴趣,但是公司内部预计很难安排相应的工作给到我,所以经过艰难的权衡,我还是决定在2022年10月离职了。


离职之后,简单尝试了几个互联网公司的面试,主要还是验证自己的一些想法,这里列举几个我印象比较深的问题。


Q:应用的换肤机制和原理


A:不知道!


车载应用虽然有换肤的需求,但是车载系统应用是基于Android Runtime Resource Overlay实现换肤,不过这套机制并不支持非系统应用,导致车载应用与移动端应用实现换肤的技术手段完全不同,所以我并没有实践过移动端应用的换肤,也就谈不上理解原理了。


结果:挂了!


Q:有没有使用过Flutter,描述一下它的绘制原理


A:额,同样不知道!!


国内主流的车载IVI系统,基本都是Android OS,也没听过车载系统应用有跨平台的需求,所以Flutter在车载应用开发领域使用的很有限,以至于做了三年车载应用开发,完全没有接触过Flutter。


结果:不出意外,挂了!


Q:插件化的原理


A:不造啊!!!


车载应用的一个重要特点就是交互逻辑要尽可能简单,方便驾驶员操作,所以车载应用一般页面都很少,基本用不上那么插件化这么复杂的工具。


结果:当然还是挂了!


简单的几次面试,基本验证了我的想法是合理的,移动端应用和车载应用开发还是有不少区别的,想进来其实并不难,但是做久了想出去就难了。


展望2023



“如果我不能教会新手,那么就说明我没有真正理解这个知识”


最近在B站看到的费曼学习法启发了我,最高效的学习方式就是,将学到的内容化繁为简的教会别人。


2022年我大约写了18篇技术性博客,但是多数时候,我都是把它当做对学习或工作内容的一次总结,回过头再来看这些内容,总结的质量差,大面积的拼凑了源码,阅读起来枯燥又乏味,而且缺乏提炼和总结,仿佛写了很多,但是抓不到重点。


所以,2023年要继续磨炼自己的写作技巧,把文章内容写得更加浅显易懂,同时也准备在B站制作一些视频教程,锻炼自己的总结能力。


转行车载的建议


为什么要写换行建议?因为总会有人问我,做手机开发如何转行车载开发,那么就在这里简单提一下。


APP工程师


基于我这次找工作的经验来看,APP工程师如果希望转行Framework岗位,实际工作经验偏少的话基本不现实,所以只能考虑转行车载APP工程师。


但是要注意的是,车载应用与移动端的应用开发还是存在一些不同的,例如开发一个车载系统设置、或SystemUI应用,使用的API往往是Android SDK没有暴露的API,手机应用开发基本不会涉及这块的内容,所以各个公司往往更愿意招聘有一定车载经验的程序员。


但是,手机应用开发转车载不代表没有机会,一般只要实力过硬,转行成功的概率还是非常大的。所以还是建议提升自己应用开发实力,写一些博客、做一些开源项目,有空闲时间的再看一下原生SystemUI、Launher、系统设置这些应用是如何实现的,都是非常不错的加分项目。


当然如果有一个211或985的学历,那就另当别论了,学历永远是硬实力!


Framework或Native/HAL工程师


从事FW或Native/HAL的工程师转行车载没什么特别值得犹豫的,FW/Native工程师一直都是车载稀缺的岗位,主机厂商也愿意接收没有车载经验的FW/Native工程师,如果转行之后薪资会迎来一波提升,那么直接转就行。


小结


以上就我的2022年终总结了,需要指出的是,文中提到的我个人的职业规划并不适用于大多数人,而且属于一个潜在风险很大的发展路径,极容易变成什么都会什么都不精,所以对于多数人我建议还是做深度发展,而不是横向发展。


写这篇总结的时候,惊讶的发觉我开始低烧了,寄,不会刚上一周的班就阳了吧。吃药休息了,咱们2023年再见吧!



作者:林栩link
来源:juejin.cn/post/7178398167954620474
收起阅读 »

错过了前三次的伟大革命(蒸汽机革命、电气革命、信息革命),GPT-4 你还要错过人工智能AI革命吗!!!

错过了前三次的伟大革命(蒸汽机革命、电气革命、信息革命),GPT-4 你还要错过人工智能AI革命吗!!! 看 GPT-4 是如何炼成绝世神功:葵花宝典? 欲练神功,不必自宫。西方不败——GPT-4! GPT-4 is OpenAI’s most advanc...
继续阅读 »

错过了前三次的伟大革命(蒸汽机革命、电气革命、信息革命),GPT-4 你还要错过人工智能AI革命吗!!!



看 GPT-4 是如何炼成绝世神功:葵花宝典?


欲练神功,不必自宫。西方不败——GPT-4!


GPT-4 is OpenAI’s most advanced system, producing safer and more useful responses


GPT-4 是 OpenAI 最先进的系统,可产生更安全、更有用的响应



image-20230317095643129.png


更牛的问题解决能力


GPT-4由于其更广泛的通用知识和解决问题的能力,可以更准确地解决难题。


Creativity 创造力


GPT-4 比以往任何时候都更具创造性和协作性。它可以生成、编辑并与用户一起完成创意和技术写作任务,例如创作歌曲、编写剧本或学习用户的写作风格。


GPT-4 Input 输入:


Explain the plot of Cinderella in a sentence where each word has to begin with the next letter in the alphabet from A to Z, without repeating any letters.
用一个句子解释灰姑娘的情节,其中每个单词必须以字母表中从 A 到 Z 的下一个字母开头,不重复任何字母。

GPT-4 Output 输出:


A beautiful Cinderella, dwelling eagerly, finally gains happiness; inspiring jealous kin, love magically nurtures opulent prince; quietly rescues, slipper triumphs, uniting very wondrously, xenial youth zealously.
美丽的灰姑娘,渴望安居,终于获得幸福;激起嫉妒的亲人,爱情神奇地孕育出富贵的王子;悄悄拯救,拖鞋胜利,团结无比,热心青年。

ChatGPT Input 输入:


Explain the plot of Cinderella in a sentence where each word has to begin with the next letter in the alphabet from A to Z, without repeating any letters.
用一个句子解释灰姑娘的情节,其中每个单词必须以字母表中从 A 到 Z 的下一个字母开头,不重复任何字母。

ChatGPT Output 输出:


After attending a ball, Cinderella dances enchantingly for good-hearted King, leaving midnight noticed or perhaps quickly returning slipper to unite victoriously with prince, resulting in ultimate victory with wonderful, extravagant, youthful zest.
参加舞会后,灰姑娘为好心的国王翩翩起舞,留下午夜的注意,或者迅速返回拖鞋,与王子胜利团结,以美妙、奢侈、青春的热情取得最终胜利。

image-20230317084912093.png


对比看下哪个更牛~


Visual input 视觉输入


GPT-4 can accept images as inputs and generate captions, classifications, and analyses.


GPT-4 可以接受图像作为输入并生成说明、分类和分析。下面是接受一个图像的输入之后,生成图像说明、分类和分析的输出结果:


image-20230317085635694.png


Input 输入:


What can I make with these ingredients?
我可以用这些原料做什么?

Output 输出:


你可以用这些原料做很多选择!一些可能性包括: 
- 煎饼或华夫饼
- 可丽饼
- 法式吐司
- 煎蛋卷或菜肉馅煎蛋饼
- 乳蛋饼
- 奶油冻或布丁
- 蛋糕或纸杯蛋糕
- 松饼或面包
- 饼干或饼干
这些只是几个例子,但可能性是无穷无尽的!

有木有很牛逼~


能够识别分析图像那就越来越接近人类了,不但可以对话,还可以感知外在的世界,如果可以聊天时有脑有嘴的话,GPT-4那现在就是有眼了,有视觉能力了。当一个机器有视觉能力之后会发生什么???大家可与脑洞一下~


有视觉能力这是GPT-4有别于前几代GPT重大的升级,也是人工智能发展到另一个新的里程碑的意义。AI 革命现在不是未来可期了,而是未来已来了,就发生在你我所处的这个共同的时代,老铁们还不赶紧上车 (观众公众号“李荣生”,了解及时准确全面的GPT的进展,ChatGPT新技术的在业务中的调教、应用和体验)


错过了前三次的伟大革命(蒸汽机革命、电气革命、信息革命),你还要错过人工智能AI革命吗!!!


Longer context 更长的上下文


GPT-4 能够处理超过 25,000 个单词的文本,允许使用长格式内容创建、扩展对话以及文档搜索和分析等用例。


Input 输入:


[Text from: https://en.wikipedia.org/wiki/Rihanna]

Describe her Super Bowl performance and what made it special.
描述她在超级碗比赛中的表现以及它的特别之处。

Output 输出:


Rihanna's Super Bowl LVII halftime show performance was special for a number of reasons. For one, it marked her first live performance in over five years, and it was her first time headlining the Super Bowl halftime show. Additionally, she made history by becoming the first person to perform at the Super Bowl while pregnant. The show itself was critically acclaimed, with many praising her high-energy performance and impressive vocals. It also garnered a massive viewership, becoming the second most-watched halftime show in history.
出于多种原因,蕾哈娜 (Rihanna) 的超级碗 LVII 中场秀表演很特别。首先,这是她五年多来的第一次现场表演,也是她第一次登上超级碗中场秀的头条新闻。此外,她还创造了历史,成为第一个在怀孕期间在超级碗上表演的人。该节目本身广受好评,许多人称赞她充满活力的表演和令人印象深刻的歌声。它还获得了巨大的收视率,成为历史上收视率第二高的中场秀。


备注: Super Bowl 超级碗是美国职业橄榄球联盟(NFL)每年举行的年度总决赛,通常在每年的二月初举行,是美国和全球最受关注和观看的单一体育赛事之一。



可以接收wikipedia网址地址的输入,并经过分析之后归纳蕾哈娜 (Rihanna)比赛的表现和特别之处。为解决部分老铁不方便之门,我把wikipedia地址的部分内容截图如下:是个美女哦~


image-20230317092527923.png


可以接收更多文字的输入,包括网址地址的搜索和分析,经过理解之后可以根据prompt提示输出,理解问题的能力更强大了。


GPT-4的能力总结一句话:会说、会看、更懂你!!!


更牛的推理能力


GPT-4 的高级推理能力超越了 ChatGPT,ChatGPT VS GPT-4 推理能力对比:


image-20230317083206574.png


ChatGPT Input 输入:


Andrew从上午11点到下午3点有空,Joanne从中午到下午2点,然后下午3:30到5点有空。Hannah在中午有半个小时的时间,然后下午4点到6点。Andrew、Hannah和Joanne 30分钟会议的开始时间有哪些选择?

ChatGPT Output 输出:


以下是它们的可用性列表:
-安德鲁:上午11点至下午3点
-乔安妮:中午至下午2点,下午3:30至下午5点
-汉娜:中午至下午12:30,下午4点至6点

根据他们的可用性,他们三人都有30分钟的可用时间,从下午4点到下午4点30分。因此,会议可以安排在下午4点。

ChatGPT-4 Input 输入:


Andrew从上午11点到下午3点有空,Joanne从中午到下午2点,然后下午3:30到5点有空。Hannah在中午有半个小时的时间,然后下午4点到6点。Andrew、Hannah和Joanne 30分钟会议的开始时间有哪些选择?

ChatGPT-4 Output 输出:


安德鲁:上午11点至下午3点
乔安妮:下午12点至2点,下午3:30至5点
汉娜:下午12点至12点30分,下午4点至6点

30分钟会议的常见时间:中午12点至中午12点30分

ChatGPT VS GPT-4 考试能力对比


参加 美国 (Uniform Bar Exam 统一律师考试)和(Biology Olympiad 生物奥林匹克竞赛考试)的对比,GPT-4 通过在测试中获得更高的近乎一百分满分数证明优于 ChatGPT。


image-20230317081742335.png



备注: Uniform Bar Exam(普通考试统一律师资格考试),简称UBE,是一个跨越美国多个州的法律考试。它是由具有法律职业监管权的各州联合开发的,旨在便捷地实现律师的跨州执业。通过UBE,考生只需参加一次考试,就能将成绩用于多个州的律师资格申请。UBE考试由三个部分组成,包括多项选择题、法律分析和写作。考试的题材涵盖了民法、刑法和司法程序等多个领域的知识。通过UBE考试是律师在跨州执业时的重要成就之一,同时也证明了其掌握了足够的法律知识和技能,能够为客户提供高质量的法律服务。


Biology Olympiad(生物奥林匹克竞赛)是一个面向中学生的国际生物学竞赛。它由国际生物学奥林匹克委员会(IBO)组织,旨在鼓励中学生研究生物学、发展科学技能以及推动全球青少年对生物学的兴趣。每年,参赛国家都会选派最优秀的中学生代表参加IBO大赛。本竞赛通常包括一系列基础和高级的生物学知识测试、实验考察和科学研究等项目。参加Biology Olympiad不仅能锻炼和展示学生的生物学技能,还可以帮助学生获得在全球范围内访问高水平生物学教育和研究资源的机会。



GPT-X 进化中


遵循 GPT、GPT-2 和 GPT-3 的研究路径,我们的深度学习方法利用更多数据和更多计算来创建越来越复杂和强大的语言模型。


gpt-4-motif-20230317081633225.svg


GPT-4进化之旅


We spent 6 months making GPT-4 safer and more aligned. GPT-4 is 82% less likely to respond to requests for disallowed content and 40% more likely to produce factual responses than GPT-3.5 on our internal evaluations.


花费了6个月的时间来确保GPT-4更加安全和准确。我们对GPT-4进行了多次内部测试和修改,使其回答不被允许的内容请求的可能性降低了82%,同时在产生事实回答时的准确率比GPT-3.5提高了40%。这意味着我们对GPT-4进行了改进,解决了其可能存在的问题,并提高了它的准确性和可靠性,使其更适合用于公共平台。


简单一句话就是:我更牛逼了~。更要命的是,这个家伙还不断迭代、不断进化中~


欲练神功,不必自宫,是否会炼就为真正的一个——西方不败(GTP-X)?


如果做到更安全和更准确?


Safety & alignment 他们(OpenAI)是这样做的:


人工反馈训练


我们在训练GPT-4时,吸收了更多人类反馈,包括ChatGPT用户提交的反馈,以改善GPT-4的行为。我们还与超过50位专家合作,包括AI安全和安全领域的专家,进行早期反馈。


通过真实世界的使用不断改进


我们将从以前模型在真实世界使用时的经验教训中,应用到GPT-4的安全研究和监控系统中。就像ChatGPT一样,随着越来越多的人使用GPT-4,我们也将以定期的节奏更新和改进它。


GPT-4协助的安全研究


GPT-4的高级推理和指令遵循能力加速了我们的安全工作。我们使用GPT-4来创建训练数据,进行模型微调,并在训练、评估和监控中迭代分类器。


有谁在使用 GPT-4 能力?


使用 GPT-4 构建创新产品的组织合作包括:


Stripe互联网支付平台 Stripe 利用 GPT-4 来简化用户体验并打击欺诈。


Morgan Stanley华尔街摩根士丹利投资银行 摩根士丹利财富管理部署 GPT-4 来组织其庞大的知识库。


Khan Academy全球在线平台可汗学院 可汗学院在有限的试点项目中探索 GPT-4 的潜力


Government of Iceland冰岛政府 冰岛如何使用 GPT-4 来保护其语言。


Duolingo GPT-4 加深了 Duolingo 上的对话。Duolingo是一款流行的语言学习应用程序,允许用户以游戏化的方式学习一系列不同的语言。Duolingo 提供了一个互动平台,通过其独特的教学方法和游戏元素,让用户在轻松有趣的环境中学习语言。Duolingo的目标是帮助人们学习语言、提高沟通技能和拓宽对其他文化的理解。它同时也为用户提供一个可持续的、个性化的学习体验。Duolingo 影响了全球数百万语言学习者,并在广泛的年龄范围内取得了成功。


Be My Eyes 利用GPT-4技术改变了视觉辅助功能。Be My Eyes是一款志愿者和盲人用户之间的求助平台。该平台让盲人用户请求帮助时,匹配到愿意帮助的志愿者。使用GPT-4技术,Be My Eyes可以识别图像并实时将描述发送给需要帮助的盲人用户。这使得盲人用户可以像有视力的人一样,获取到更多关于周围环境的信息。


通过在技术上方便快捷地连接盲人用户和有视力的志愿者,Be My Eyes广泛地改变着视觉障碍群体的生活中的社交和日常方面。这项技术帮助他们更好地融入社会,增强了他们的自信和独立性。最重要的是,Be My Eyes通过与GPT-4技术的整合,成为了利用人工智能的科技慈善的优秀典范。


还有下面其他应用案例:


image-20230317074524959.png


gpt-4-motif.svg


关于 GPT-4 的更多信息


More on GPT-4 :


Research 研究GPT-4 是 OpenAI 在深度学习扩展方面的最新里程碑。详情请查看 GPT-4 研究
Infrastructure基础设施GPT-4 是在微软 Azure AI 超级计算机上进行训练的。Azure 的人工智能优化基础设施还使我们能够向全球用户提供 GPT-4。
Limitations 限制GPT-4 仍然存在许多已知的限制,例如社会偏见、幻觉和对抗性提示,我们正在努力解决这些问题。随着社会采用这些模型,我们鼓励和促进透明度、用户教育和更广泛的人工智能素养。我们还旨在扩大人们在塑造我们的模型方面的输入途径。
Availability 可用性GPT-4 在 ChatGPT Plus 上可用,并作为 API 提供给开发人员构建应用和服务。

We’re excited to see how people use GPT-4 as we work towards developing technologies that empower everyone.


我们很期待看到人们如何使用 GPT-4,同时我们将努力开发能够赋予每个人权力的技术。


View contributions


GPT-4 API 候补名单


We’re making GPT-4 available as an API for developers to build applications and services.


我们将 GPT-4 作为 API 供开发人员构建应用程序和服务。


Join waitlist 加入候补名单


image-20230317073049107.png


加入候补名单地址:openai.com/waitlist/gp…


Availability 可用性


During the gradual rollout of GPT-4, we’re prioritizing API access to developers that contribute exceptional model evaluations to OpenAI Evals to learn how we can improve the model for everyone. We are processing requests for the 8K and 32K engines at different rates based on capacity, so you may receive access to them at different times. Researchers studying the societal impact of AI or AI alignment issues can also apply for subsidized access via our Researcher Access Program.


在 GPT-4 的逐步推出期间,我们优先考虑为 OpenAI Evals 贡献卓越模型评估的开发人员访问 API,以了解我们如何为每个人改进模型。我们正在根据容量以不同的速率处理对 8K 和 32K 引擎的请求,因此您可能会在不同时间获得对它们的访问权限。研究 AI 的社会影响或 AI 对齐问题的研究人员也可以通过我们的研究人员访问计划申请补贴访问。


For use cases we tried, GPT-3.5 did not reliably handle multi-language text. We hope to explore GPT-4 for this use case.


对于我们尝试的用例,GPT-3.5不能可靠地处理多语言文本。我们希望为这个用例探索GPT-4。


作者:KonyLee
来源:juejin.cn/post/7211734661762973733
收起阅读 »

百度的文心一言 没有想象中那么差

robin 的演示 我们用 robin 的演示例子来对比一下 文心一言和 ChatGPT 的真实表现(毕竟发布会上是录的)。 注意,我使用的 GPT 版本是 4.0 文学创作 1 三体的作者是哪里人? 文心一言: ChatGPT: 嗯,中文表现上文心一言更...
继续阅读 »

robin 的演示


我们用 robin 的演示例子来对比一下 文心一言和 ChatGPT 的真实表现(毕竟发布会上是录的)。 注意,我使用的 GPT 版本是 4.0


文学创作


1 三体的作者是哪里人?


文心一言:


ChatGPT:


嗯,中文表现上文心一言更好。


2 电视剧三体的演员都有谁?


文心一言:


ChatGPT:



关于这个问题 ,由于 ChatGPT 的数据只能查到 2021 年的,所以它不知道是正常的。


3 主演 于和伟 和 张鲁一 谁更高?


文心一言:


ChatGPT:


4 可以总结一下《三体》的核心内容吗?如果要续写的话,可以从哪些角度出发?


文心一言:


ChatGPT:



虽然网络出一点儿问题,但我更喜欢 ChatGPT 的回答。


商业文案创作


1 如果要成立一个用大模型服务中小企业数字化升级的科技服务公司,可以起个什么公司名?


文心一言:


ChatGPT:


显然我更喜欢文心一言的,但如果你跟 ChatGP 继续聊下去,它可能提供更进一步符合你需求的答案。


2 数智云图这个名称不错,给我起一个公司的服务 Slogan,表达共赢的概念


文心一言:


ChatGPT:



这一轮文心一言的回答更好。


3 帮我生成一篇公司成立的新闻稿,数智云图以共赢的服务理念用大模型服务中小企业数字化升级。字数 600 字


文心一言:


ChatGPT:


ChatGPT 试了几次网络都有问题,这一轮不好评价。


数理逻辑推算任务


1 鸡兔同笼问题


文心一言:


ChatGPT:



这一轮没有意外,我更喜欢 ChatGPT 的回答。


中文理解能力


1 “洛阳纸贵”是什么意思?


文心一言:


ChatGPT:


感觉差不多。


2 当时洛阳的纸到底有多贵?


文心一言:


ChatGPT:


那么这一题,ChatGPT 开始一本正经的胡说八道了。


3 这个成语在现在的经济学原理里,对应的理论是什么?


文心一言:


ChatGPT:


4 用洛阳纸贵四个字写一首藏头诗。


文心一言:



ChatGPT:


ChatGPT 给出的结果明显不对。


多模态生成


目前文心一言的测试版本并不能生成语音和视频,但是可以直接生成图片,图片的质量比想象中的要好,而且还有很多的风格可以选择,比如说卡通风格,油画风格,还有很多的风格,可以满足不同的需求。


绘画能力应该是集成了现成的文心一格。


以下是我试的几个例子


描述: 请为 2023 世界智能交通大会创作一张海报。



描述:“灌木丛中的一朵机械花,有金属花瓣,周围环境和人的镜面反射,鸟瞰图。 构图夸张,具有强烈的视觉冲击力和叙事性”



描述:“雨天香港、哥特式建筑 3D 画风”



描述:“一只睡在柜子上面的猫,卡通风格”



描述:“麦田中的少年,油画风”


坦率讲与 midjourney 的绘画能力相比,文心一格的绘画能力还是有差距的。


编程


1 请帮我写一个网页版的贪吃蛇游戏


文心一言:


ChatGPT:


虽然又遇到了网络问题,但各位开发老铁们,不用我说了吧,都知道该选啥哈


2 生成测试数据


文心一言:



ChatGPT:


ChatGPT 完胜


文心一言使用注意事项


在使用过程中出现了排队的情况:



这我在使用 ChatGPT 的时候可没有遇到过。


可以输入“/” 来获取模版



绘画的例子上文举过了,我们来看看剩下 2 个:


查一个知识



写一篇报告



总结


经过试用文心一言,再对比 ChatGPT,我认为:文心在中文语料上应该是更丰富些。多语言上目前一定不如 ChatGPT 优秀。虽然这两个模型在某些方面有所重叠,但它们在应对特定语言和领域问题时具有各自的优势。


其实最令我意外的是,文心一言并没有发布会时让人感觉的那么差。它不是 chatPPT, 至少目前看不是,它完成了从 0 到 1 的过程 ,虽然有差距,但还是真心地希望国内的企业能够在 AI 的领域做出一些成绩,而不是一味地跟风。




我现在理解了 😊


作者:xiaohezi
来源:juejin.cn/post/7211467514413367351
收起阅读 »

对标chatgpt?百度今日正式发布文心一言

3月16日下午,百度正式发布文心一言,包括五大能力——“文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成”。 百度李彦宏介绍称,内测中“文心一言”并不完美,但市场有需求必须要推出来。 《文心雕龙》是一本中国古代文学批评著作,作者刘勰在书中提出了“文心...
继续阅读 »

3月16日下午,百度正式发布文心一言,包括五大能力——“文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成”。


百度李彦宏介绍称,内测中“文心一言”并不完美,但市场有需求必须要推出来。


《文心雕龙》是一本中国古代文学批评著作,作者刘勰在书中提出了“文心”这一概念,指的是文学创作的内心体验和情感表达。《一言》则是唐代文学家韩愈的一篇散文,其中提到“一言既出,驷马难追”,意思是说一旦说出口的话就很难收回。


因此,百度的名字“文心一言”寓意着搜索引擎能够帮助人们快速地找到自己想要的信息,同时也提醒人们在言行上要慎重,避免后悔。


image.png


文心一言五大能力


新闻发布会现场,李彦宏展示了文心一言在五个使用场景的表现,包括文学创作、商业文案创作、数理推算、中文理解和多模态生成。从直播展示来看,文心一言某种程度上具有了对人类意图的理解能力,回答的准确性、逻辑性、流畅性都逐渐接近人类水平。但李彦宏也多次提及,这类大语言模型还远未到发展完善的阶段,进步空间很大,未来这段时间它一定会飞速发展,日新月异。


中文理解


image.png


多模态内容




  • 根据描述生成海报
    image.png




  • 用四川话语音讲述
    image.png




  • 视频生成能力
    不会对所有用户开放,百家号之前已经在运用。




image.png


对话式 AI 涉及的技术方向


image.png


文心大模型框架图


image.png


文心一言已有650家生态合作伙伴


文心一言已有650家生态合作伙伴


生成式大模型的三大产业机会


image.png


文心一言体验方式


百度同时公布了文心一言的邀请测试方案。3月16日起,首批用户即可通过邀请测试码,在文心一言官网体验产品,后续将陆续开放给更多用户。此外,百度智能云即将面向企业客户开放文心一言API接口调用服务。3月16日起正式开放预约,搜索“百度智能云”进入官网,可申请加入文心一言云服务测试。


作者:Captaincc
链接:https://juejin.cn/post/7210996975981690936
来源:稀土掘金
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
收起阅读 »

我尝试用ChatGPT理解了下GPT4的现场直播,结果。。。

今天一早醒来,就被GPT4的发布给霸屏了。OpenAI官网上的介绍确实过于震撼,各个公众号的文章中也有提及,从专业考试到人类梗图,GPT4不只是回答的像模像样,更超越了我们这些普通人。 除了这些具体任务上的表现,GPT4的能力也有了突破——不仅可以处理更长的内...
继续阅读 »

今天一早醒来,就被GPT4的发布给霸屏了。OpenAI官网上的介绍确实过于震撼,各个公众号的文章中也有提及,从专业考试到人类梗图,GPT4不只是回答的像模像样,更超越了我们这些普通人。


除了这些具体任务上的表现,GPT4的能力也有了突破——不仅可以处理更长的内容(最长3.2万个token),也可以更好的理解图像内容。除了能力的增强,GPT4也更安全、更人性化了。


除了官网的Blog,OpenAI在北京时间2023年3月15日凌晨1点举办了一场25分钟左右的直播,具体展示GPT4的新能力。视频已经发布在国外某视频网站上,我们这就尝试用ChatGPT来总结一下这个现场直播的主要内容。


工具与原理


这里主要使用了VidSummize扩展,该扩展可以解析视频网站的字幕,并且利用OpenAI的API对字母内容进行分析。结合特定的prompt,便可以生成视频的概述。


prompt设置


这里采用默认的prompt,具体如下:



summarize this text using bullet points, give it a big, bold heading as well. make it: easy to read and exhaustive but also provide context on topics or concepts the reader might not know of if necessary. remember that you heading should be separated by two new lines from the bullet points.



翻译过来就是:



请使用项目符号列出要点,提供一个大而醒目的标题,并确保易读且详尽。如有必要,请为读者提供有关主题或概念的背景信息。请注意,您的标题应与项目符号间隔两个新行。



模型设置


这里选择使用ChatGPT类的Turbo模型——GPT-3.5-Turbo


结果展示


等待片刻,ChatGPT分析后的输出结果为:



Chapter 1 - OpenAI Demonstrates GPT-4 Capabilities in Live Stream



  • OpenAI has been building GPT-4 technology for the past two years

  • The company has focused on delivering GPT4 by rebuilding their entire training stack and testing it in real-world scenarios

  • OpenAI demonstrated how to make GPT-4 shine and get the most out of it

  • The company showed how to use GPT-4 as a tool and partner

  • OpenAI showcased GPT-4s ability to summarize an article with every word beginning with a specific letter

  • The company also demonstrated how a Discord using GPT-4 as an AI programming assistant

  • GPT-4 can leverage documentation it has not memorized and can synthesize new content in new ways

  • OpenAI showed how to debug code with GPT-4 and how it can accept inputs that intersperse images and text.


Chapter 2 - Using GPT-4 to Accomplish Tasks and Solve Problems



  • GPT-4 is a neural network that can be used to accomplish tasks and solve problems.

  • It can be used to describe images in detail, even if they are not explicitly tagged.

  • GPT-4 can also be used to understand dense content, such as tax code, and provide explanations and calculations.

  • The model is still being developed and optimized for prime time use.

  • GPT-4 has a length limit of32,000 tokens and be used for long documents.

  • The system message can be to get the in the mood of the task at hand.

  • GPT can output and create working websites from hand-drawn mock-ups.

  • The model can be used as an augmenting tool to increase productivity, but it is important to be in the drivers seat and understand what is going.

  • PT is flexible system that applied various and applications.


Chapter 3 - Exciting Opportunities with OpenAI Evals



  • OpenAI Evals is a model that can be improved by contributions from everyone

  • Improving the model can benefit a lot of people

  • OpenAI Evals offers exciting opportunities for building new things

  • The team is excited to see what people will build with the model

  • Contributions to OpenAI Evals are welcome and encouraged



对应的中文如下:



第一章 - OpenAI在直播中展示了GPT-4的能力



  • OpenAI过去两年一直在开发GPT-4技术。

  • 公司专注于通过重新构建整个训练系统并在真实情境中测试它来交付GPT4。

  • OpenAI展示了如何让GPT-4发挥作用并充分利用它。

  • 公司展示了如何将GPT-4用作工具和合作伙伴。

  • OpenAI展示了GPT-4摘要文章的能力,每个单词都以特定字母开头。

  • 公司还演示了使用GPT-4作为AI编程助手的Discord。

  • GPT-4可以利用它没有记忆的文档,并以新的方式综合新内容。

  • OpenAI展示了如何使用GPT-4调试代码以及如何接受交替图片和文本的输入。


第二章 - 使用GPT-4完成任务和解决问题



  • GPT-4是一个神经网络,可用于完成任务和解决问题。

  • 即使没有明确标记,它也可以详细描述图像。

  • GPT-4还可用于理解密集内容,例如税法,并提供解释和计算。

  • 该模型仍在开发和优化中,以供主流使用。

  • GPT-4的长度限制为32,000个标记,可用于长文档。

  • 系统消息可用于让用户进入工作状态。

  • GPT可以从手绘模型中输出和创建工作网站。

  • 该模型可用作增强工具,以提高生产力,但重要的是要掌握局面并理解正在进行的工作。

  • PT是灵活的系统,适用于各种应用程序。


第三章 - OpenAI Evals带来令人兴奋的机遇



  • OpenAI Evals是一个可以通过所有人的贡献改进的模型。

  • 改进模型可以惠及许多人。

  • OpenAI Evals为构建新事物提供了令人兴奋的机遇。

  • 团队很高兴看到人们将用该模型构建什么。

  • 欢迎和鼓励为OpenAI Evals做出贡献。



可以看出,这个结果很详尽,但是其中也会包含一些词法和语法错误,但这些并不影响我们了解视频的大体内容。


最后我再人工总结下直播中关键demo:



  • 结对编程时,代码运行出现错误的情况下通过输入最新文档进行bug修复

  • 对图片以及带梗的图片进行理解

  • 根据手绘图片,生成页面代码

  • 输入超长的税法条文,分析计算应纳税额

  • 总结编写打油诗


上述内容的截图如下(可参考截图中的视频时间查看原始视频):


结对编程解决BUG


图片内容理解


手绘图片转网页,这里出现了一个非技术原因导致的“翻车”


纳税额计算


打油诗内容总结


总结


相比ChatGTP,GPT4升级的地方主要有以下几个方面:



  • token的数量上有了很大的提升,从ChatGPT的4096直接提升到了32000,高了一个数量级,这使得普通人依赖机器解决专业问题(计算税、阅读法律条文)成为了可能。

  • 具备了多模态能力——除了自然语言,目前还可以处理图片。

  • 在逻辑推理能力上也有显著提升。


目前官网暂时没有给出GPT4的API,所以即刻体验的方式只有一种:加入ChatGPT Pro计划。需要等待体验的方式就是加入WaitingList排队,可以通过给OpenAI Evals贡献模型评价加快排队进度。


作者:centurysee
链接:https://juejin.cn/post/7210747150827913272
来源:稀土掘金
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
收起阅读 »