注册
环信即时通讯云

环信即时通讯云

单聊、群聊、聊天室...
环信开发文档

环信开发文档

Demo体验

Demo体验

场景Demo,开箱即用
RTE开发者社区

RTE开发者社区

汇聚音视频领域技术干货,分享行业资讯
技术讨论区

技术讨论区

技术交流、答疑
资源下载

资源下载

收集了海量宝藏开发资源
iOS Library

iOS Library

不需要辛辛苦苦的去找轮子, 这里都有
Android Library

Android Library

不需要辛辛苦苦的去找轮子, 这里都有

AI不会干掉程序员,反而会为程序员带来更多工作机会

AI不会干掉程序员,反而会为程序员带来更多工作机会 从chatGPT出来那一刻起,我就一直在思考这个问题:我们程序员是不是马上要被AI干掉了?搞得自己非常焦虑,各种自我怀疑,对除AI外的任何技术都失去了兴趣。网上也有各种铺天盖地的观点,大多数的title都是以...
继续阅读 »

AI不会干掉程序员,反而会为程序员带来更多工作机会


从chatGPT出来那一刻起,我就一直在思考这个问题:我们程序员是不是马上要被AI干掉了?搞得自己非常焦虑,各种自我怀疑,对除AI外的任何技术都失去了兴趣。网上也有各种铺天盖地的观点,大多数的title都是以"AI即将干掉程序员"开头,贩卖焦虑。
在今年这种大环境本身就非常不好的时候,AI的出现仿佛是雪上加霜,让我们对未来完全失去信心,感觉未来一片灰暗。甚至很多人开始研究起了自己失业后可以干哪些行业,如外卖员、网约车等。


对于我们是否会马上被AI干掉这个问题,通过这几个月不断的思考、学习、推理,总算有了一些自己的答案,在此做一个分享与总结。


AI出现后软件行业会变成怎样?


去除杂念,以史为鉴,尊重逻辑。


会出现各种各样基于AI的新型应用


这里的新型应用主要是在没有AI的加持下无法实现的应用。如AI医生、AI老师等。


当你身体出现异常的时候,很多人的第一反应就是先百度一下,然后吓出一身冷汗,然后医院检查,最后虚惊一场。


这里最大的问题就是我们通过搜索引擎很难精确地描述出病情,当我们去门诊诊断的时候,医生会问我们多轮问题,才能给出初步诊断。多轮问题是目前的搜索引擎无法做到的,但它却正好是ChatGPT的强项。


如果有AI加持,再加上有效的训练数据,AI医生就可以通过和你的多轮对话,给出更加准确的初步诊断。


当AI医生诞生后,你小孩发烧的时候你就可以以非常小的成本得到非常准确的处理方案,如是否需要物理降温、是否需要立即吃药、如果吃药应该吃什么药什么量等。而在这之前,你需要到网上搜索各种资料,不仅效率低下,还有可能得到一些质量很低的搜索结果,甚至错误的结果。因为想在网上搜索出一篇权威的文章是非常困难的。


另外,AI教师也是非常有用的应用。在AI老师出现以后,你的小孩可能就不再需要你的辅导就能完成各种题目的解答,且AI老师可以给出更好的解题思路,更准确的答案。AI教师除了可以教授K12,还能教授各个垂直领域的知识,这是一个非常巨大的市场,未来一定会出现各种各样的AI教师平台。


现有应用会逐步AI化


看文档真的很累,但是如果有一个掌握文档所有细节的人坐在你旁边为你服务,你还会那么累吗?这就是未来的AI文档。你只需要提出问题,AI就可以教你如何使用软件或者api而不需要一字一句的去研究文档。


除了文档,政府的各种政策、法律条文、保险条款等,未来都将AI化,我们每个人都可以拥有自己专有的“人工客服”,以前需要看几个小时文件才能得出的答案,现在可能一分钟就能得到答案了,而且更加准确!


未来的政府、保险公司等同类型主体间的信息化较量,很可能就是AI能力的较量。


软件行业的AI化,对程序员来说意味着什么?


政府的政策发布系统要升级、保险公司的客服系统要升级,AI医生、AI老师需要开发,这个工作量最终是由谁来完成?程序员。


很多人可能会说,既然AI会写代码了,那么为什么不是AI直接对现有系统进行升级或者自我孵化新应用?


AI完全替代程序员?这个事情真的那么简单吗?


仅从技术的角度来看,当前的AI虽然可以写一些小模块,但是要完成一个复杂系统的架构、研发、部署,AI当前还有些力不从心。现在AI可以完成一些点上的东西,但是我们的大型应用是需要把这些点组合起来,点与点之间还有很深的业务关联的。


虽然AI迭代速度很快,但是不要忘了即使是AI,要学习新的知识也需要人类去训练,而这个训练的成本不仅仅是人力成本,还有时间成本。想要AI完全达到人类程序员的理解能力和开发能力,可能不是一两年就能够实现的事情。


退一万步,即便是AI具备了编写复杂程序的能力,那谁来监督它,测试它?自动驾驶技术推出了这么多年,为什么没有很快替代人类司机?就是因为验证可靠性是一个非常复杂的过程,路遥才能知马力。信任关系不是一天两天的相处就能建立起来的。特别是这种涉及公司信息安全、软件可靠性的信任关系。


因此,正是由于将来会出现各种新型AI应用,以及现有应用需要AI化,才诞生了大量的工作量。这是一个行业基础设施的大升级,基建永远是最容易诞生工作机会的,程序员不仅不会失业,还会在这一波大基建建设中得到新一轮的工作机会


对于AI加持后的程序员工作畅享


‘基于型’程序员


我们现在开发软件,大多数情况都逃不过‘基于’二字。基于vue、基于react、基于flutter等等。


为什么会去‘基于’,就是因为这些框架或者库,能够提高我们的工作效率,减轻我们的心智负担,让开发复杂的应用变得简单。


我们基于的内容就是基础设施,而AI就是一种天然的基础设施。


未来一定会有大型的、成熟的AI平台和工具供我们‘基于’。当我们要开发一个AI应用,我们不需要自己去训练我们的基础模型,而是基于一个成熟的AI模型进行微调或者二次训练,就可以得到我们定制的AI模型,从而实现我们应用所需要的功能。


比如我们需要对公司开发的平台软件的文档进行AI化,我们不需要自己去训练一个AI机器人,而是基于现有大语言模型平台,新建一个AI实例,然后把我们的文档内容喂给这个实例,它就能变成一个我们定制的AI客服。我们还可以为这个实例设置各种参数,如定制它的聊天风格是严肃的还是活泼的、如定制它对于不相关的问题拒绝回答等等,当然这些参数都是AI平台提供的功能。


虽然AI可以帮我们编写如何调用平台api的代码,但是如何把这些代码集成到我们现有的软件中,还需要人类程序员的帮忙。


‘效率型’程序员


当有了AI大模型的加持,我们在写程序的过程中,可以让AI帮我们把一些点上的东西迅速完成掉,从而提高我们的编码效率。


如我们现在是一个vue新手,我们想实现一个列表的渲染。在从前我们可能需要去查阅vue官方文档,但是未来我们也许只需要问一问vue官方提供的机器人,它便能直接给出代码和解释。以前半个小时才能完成的工作量,现在10分钟便能完成。


而今日,已经有copilot,codeium这种ai编程工具,直接集成在编辑器中猜测我们的意图,很多情况下我们只需要按一按tab即可,甚至只需要在注释中描写下我们要实现的功能,它就能直接给出最终的代码。但是不要忘记,我们还是要写提示、写注释AI才能工作的,它只是让我们写得更快,即使没有AI,我们一样能完成最终的工能。


‘靠谱型’程序员


当我们一口气写完一个复杂的组件后,我们需要进行手工测试才能验证它的可靠性。而很多bug是在自测的时候很难发现的。有了AI加持后,我们写完一段代码就可以让它帮我们看看有没有什么明显的bug,然后迅速进行修复。把我们的代码喂给AI过一遍,可以让我们的代码更加靠谱,心里也更加有底气。这就相当于两个人在结对编程,而且和你结对的这个人水平还很高,很少出错,不会骂你是lowB,这样的编程体验,是不是真的好了很多?


一些建议


活到老,学到老。chatGPT和GEN应用的诞生让AI突然在今年爆发。我们能做的就是拥抱变化,积极去学习新式的编程方式,去学习使用AI带来的新工具、新平台。任何事情都有两面性,挑战和机遇永远都是并存。我们要做的不是自怨自艾,而是积极面对未来,未来不仅仅是AI,还会有各种各样不确定的事情等待着我们。正是这些不断出现的新东西让我们的人生更加丰富多彩,身在这个时代,真的很累,也真的很酷。


作者:libmw
链接:https://juejin.cn/post/7242113868552929340
来源:稀土掘金
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
收起阅读 »

都什么年代了,还在用传统方式写代码?

前言 还在把 AI 当作搜索引擎的替代品,有问题才问 AI,没问题就在那边吭哧吭哧地撸代码?如果是这样,那你真的 OUT了!现在正经人谁还自己一行行地写代码啊,都是 AI 生成的代码——没有 AI 我不写(手动滑稽)。 本文将分享 AI 时代的编程新实践,教你...
继续阅读 »

前言


还在把 AI 当作搜索引擎的替代品,有问题才问 AI,没问题就在那边吭哧吭哧地撸代码?如果是这样,那你真的 OUT了!现在正经人谁还自己一行行地写代码啊,都是 AI 生成的代码——没有 AI 我不写(手动滑稽)。


本文将分享 AI 时代的编程新实践,教你如何从一个 "Ctrl + C"、 "Ctrl + V" 工程师,变成一个 "Tab + Enter" 工程师🤣。


开发流程


软件的一般研发流程为:

  1. 需求分析
  2. 程序设计
  3. 代码编写
  4. 软件测试
  5. 部署上线

我们在这里主要关心步骤2~4,因为与 AI 结合得比较紧密。虽然需求分析也可以借助 AI,但不是本文的重点,故不做讨论。


程序设计


经过需求分析、逻辑梳理后,在编写实际代码前,需要进行程序设计。


此环节的产物是设计文档,是什么类型的设计文档不重要,重要的是伪代码的输出。


虽然《Code Complete》早就推荐过伪代码的实践,但对此人们容易有一个误区:认为写伪代码花的时间,已经够把实际代码写好了。但 AIGC 时代,此问题可以轻松破解:AI 写代码的速度肯定比人快,因此,只要能找到方法能让 AI 生成符合需求的代码,就值得花时间去研究。而伪代码,就是让 AI 快速生成符合期望的实际代码的最好方式。


为什么这么说呢?因为想要让 AIGC 符合期望,恰当的 Prompt 必不可少。但如何写好这个 Prompt,需要提供多少上下文,才能让 AI 更好地理解我们的意图,这是需要技巧、需要调试的。而经过精心设计的伪代码,本身已经提供了足够的上下文,且意图足够聚焦,减轻了对 Prompt 的要求,又提高了 AIGC 的成功率。


我们来看一下伪代码示例:

plainText = JSON.stringify(data)
digest = hash(plainText) // 防篡改
secret = Symmetric.getKey()
cipherText = encryptText(data, secret) // 防内容泄密


pair = Asymmetric.getPair()
cipherSecret = encryptKey(secret, pair.getPrivateKey()) // 防密钥泄露

return {
digest,
cipherText,
cipherSecret,
pair.getPublicKey(),
}

上述代码主要表达的内容是:

  1. 对初始数据进行加密
  2. 返回加密后的相关内容
  3. 涉及到了一系列的算法

对于伪代码的编写,有如以建议:

  1. 不要纠结类型,不要局限于某一种编程语言的语法,不用试图写能编译通过的代码——这只会限制了你的表达
  2. 命名一定要准确,符合领域术语,这一点很关键。这一点可以通过查找资料、看书、问 AI 来实现。千万不要只是生硬地汉译英,不专业的表达会妨碍 AI 的理解

代码编写


代码编写分为以下几步:

  1. 把伪代码转换成目标语言可执行的代码
  2. 根据项目情况,对生成的代码进行改造
  3. 利用 AI 编码辅助工具编写剩余的代码

生成真实代码


让 AI 生成代码的 prompt 很简单,示例如下(根据目标语言进行修改):

please transform the following pseudo code into practical java code ```
your code```please transform the following pseudo code into practical java code ```
your code```

使用 chatGPT 结果截图:



完整代码如下:

import com.fasterxml.jackson.databind.ObjectMapper;

import javax.crypto.Cipher;
import javax.crypto.KeyGenerator;
import javax.crypto.SecretKey;
import java.security.*;

public class EncryptionExample {

public static void main(String[] args) throws Exception {
// Prepare the license data
LicenseData licenseData = new LicenseData();
licenseData.setLicenseId("123");
licenseData.setLicenseType("Standard");

// Convert the license data to JSON string
ObjectMapper objectMapper = new ObjectMapper();
String plainText = objectMapper.writeValueAsString(licenseData);

// Hash the plain text
String digest = hash(plainText);

// Generate a symmetric key
SecretKey secretKey = generateSymmetricKey();

// Encrypt the license data with the symmetric key
byte[] cipherText = encryptText(plainText, secretKey);

// Generate an asymmetric key pair
KeyPair keyPair = generateAsymmetricKeyPair();

// Encrypt the symmetric key with the private key
byte[] cipherSecret = encryptKey(secretKey.getEncoded(), keyPair.getPrivate());

// Print the results
System.out.println("Plain Text: " + plainText);
System.out.println("Digest: " + digest);
System.out.println("Cipher Text: " + new String(cipherText));
System.out.println("Cipher Secret: " + new String(cipherSecret));
}

public static String hash(String input) throws NoSuchAlgorithmException {
MessageDigest digest = MessageDigest.getInstance("SHA-256");
byte[] hash = digest.digest(input.getBytes());
return bytesToHex(hash);
}

public static SecretKey generateSymmetricKey() throws NoSuchAlgorithmException {
KeyGenerator keyGenerator = KeyGenerator.getInstance("AES");
keyGenerator.init(128);
return keyGenerator.generateKey();
}

public static byte[] encryptText(String data, SecretKey key) throws Exception {
Cipher cipher = Cipher.getInstance("AES");
cipher.init(Cipher.ENCRYPT_MODE, key);
return cipher.doFinal(data.getBytes());
}

public static byte[] encryptKey(byte[] secret, PrivateKey privateKey) throws Exception {
Cipher cipher = Cipher.getInstance("RSA");
cipher.init(Cipher.ENCRYPT_MODE, privateKey);
return cipher.doFinal(secret);
}

public static KeyPair generateAsymmetricKeyPair() throws NoSuchAlgorithmException {
KeyPairGenerator keyPairGenerator = KeyPairGenerator.getInstance("RSA");
keyPairGenerator.initialize(2048);
return keyPairGenerator.generateKeyPair();
}

public static String bytesToHex(byte[] bytes) {
StringBuilder result = new StringBuilder();
for (byte b : bytes) {
result.append(String.format("x", b));
}
return result.toString();
}

public static class LicenseData {
private String licenseId;
private String licenseType;

public String getLicenseId() {
return licenseId;
}

public void setLicenseId(String licenseId) {
this.licenseId = licenseId;
}

public String getLicenseType() {
return licenseType;
}

public void setLicenseType(String licenseType) {
this.licenseType = licenseType;
}
}
}

把上述代码 copy 下来,放到工程中,根据需要改造即可。


这里特别要说下,强烈推荐使用原版 AI,而不是寻找平替,同样的 prompt,下图是某一平替输出的结果:


只生成了函数声明,没有生成函数实现。二者对比,未免相形见绌。



辅助编程工具


改造的过程中,少不了 AI pair programming tools。对此,我推荐使用 Amazon 的 CodeWhisperer,原因很简单,跟 GitHub Copilot 相比,它是免费的😃。


CodeWhisperer 的安装可以看文末的安装教程,我们先来看一下它是怎么辅助我们编码的。


第一种方式是最简单的,那就是什么都不管,等待智能提示即可,就好像 IDEA 原来的提示一样,只不过更智能。


下图示例中,要把原来的中文异常提示,修改成英文,而我只输入了两个字符 IM, 就得到了智能提示,补全了完整的英文字符串!



可以注意到,上图的智能建议一共有 5 条,相应的快捷键为:

  1. 方向键 ->,查看下一条提示
  2. 方向键 <-,查看上一条提示
  3. Tab,采用该提示
  4. Esc,拒绝提示

我们再来看第二种 CodeWhisperer 的使用方式,编写注释,获得编码建议。



最后一种就是编写一个空函数,让 CodeWhisperer 根据函数名去猜测函数的实现,这种情况需要足够的上下文,才能得到令人满意的结果。


软件测试


AI 生成的内容,并不是完全可信任的,因此,单元测试的重要性变得尤为突出。


对上述代码编写测试代码后,实际上并不能一次通过,因为前面 AI 生成的代码参数有误。


此时需要一边执行单测,一边根据结果与 AI 进行交互:



经过修改,最终测试用例通过👏!



总结


本文通过案例,展示了 AI 如何结合软件研发的流程,提升我们的编程效率的。


其中,个人认为最重要的是编写伪代码与进行单元测试。有趣的是,这两样实践在 AIGC 时代之前,就已经被认为是最佳实践。这给我们启示:某些方法论、实践经得起时间的考验,技术更新迭代,它们历久弥新。


另外,AI 是否能进一步渗透我们的工作流,还有待探索。此文作引抛砖引玉之用,期待大家的后续分享。


附:CodeWhisperer 安装


下载 2023 年的 IDEA,打开 Plugins Marketplace,找到 AWS Toolkit



安装完成、重启 IDEA 后,点击左下角,按下图所示操作:




如果第一次使用,就点击 1 处进行注册,如果已经有账号了,就点击 2 处使用自己的账号登录。



注册、登录、授权成功后,出现如图所示页面,即可使用 CodeWhisperer。



作者:levy9527
链接:https://juejin.cn/post/7255309681547411513
来源:稀土掘金
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
收起阅读 »

挤爆服务器,北大法律大模型ChatLaw火了:直接告诉你张三怎么判!

语言大模型不断向垂直行业领域拓展,这次出圈的是北大法律大模型。 大模型又「爆了」。 昨晚,一个法律大模型 ChatLaw 登上了知乎热搜榜榜首。热度最高时达到了 2000 万左右。 这个 ChatLaw 由北大团队发布,致力于提供普惠的法律服务。一方面当前全...
继续阅读 »

语言大模型不断向垂直行业领域拓展,这次出圈的是北大法律大模型。



大模型又「爆了」。


昨晚,一个法律大模型 ChatLaw 登上了知乎热搜榜榜首。热度最高时达到了 2000 万左右。


这个 ChatLaw 由北大团队发布,致力于提供普惠的法律服务。一方面当前全国执业律师不足,供给远远小于法律需求;另一方面普通人对法律知识和条文存在天然鸿沟,无法运用法律武器保护自己。


大语言模型最近的崛起正好为普通人以对话方式咨询法律相关问题提供了一个绝佳契机。



目前,ChatLaw 共有三个版本,分别如下:




  • ChatLaw-13B,为学术 demo 版,基于姜子牙 Ziya-LLaMA-13B-v1 训练而来,中文各项表现很好。但是,逻辑复杂的法律问答效果不佳,需要用更大参数的模型来解决;




  • ChatLaw-33B,也为学术 demo 版,基于 Anima-33B 训练而来,逻辑推理能力大幅提升。但是,由于 Anima 的中文语料过少,问答时常会出现英文数据;




  • ChatLaw-Text2Vec,使用 93w 条判决案例做成的数据集,基于 BERT 训练了一个相似度匹配模型,可以将用户提问信息和对应的法条相匹配。




根据官方演示,ChatLaw 支持用户上传文件、录音等法律材料,帮助他们归纳和分析,生成可视化导图、图表等。此外,ChatLaw 可以基于事实生成法律建议、法律文书。该项目在 GitHub 上的 Star 量达到了 1.1k。



官网地址
http://www.chatlaw.cloud/


论文地址
arxiv.org/pdf/2306.16…


GitHub 地址
github.com/PKU-YuanGro…


目前,由于 ChatLaw 项目太过火爆,服务器暂时崩溃,算力已达上限。该团队正在修复,感兴趣的读者可以在 GitHub 上部署测试版模型。


小编本人也还在内测排队中。所以这里先展示一个 ChatLaw 团队提供的官方对话示例,关于日常网购时可能会遇到的「七天无理由退货」问题。不得不说,ChatLaw 回答挺全的。



不过,小编发现,ChatLaw 的学术 demo 版本可以试用,遗憾的是没有接入法律咨询功能,只提供了简单的对话咨询服务。这里尝试问了几个问题。





其实最近发布法律大模型的不只有北大一家。上个月底,幂律智能联合智谱 AI 发布了千亿参数级法律垂直大模型 PowerLawGLM。据悉该模型针对中文法律场景的应用效果展现出了独特优势。


图源:幂律智能


ChatLaw 的数据来源、训练框架


首先是数据组成。ChatLaw 数据主要由论坛、新闻、法条、司法解释、法律咨询、法考题、判决文书组成,随后经过清洗、数据增强等来构造对话数据。同时,通过与北大国际法学院、行业知名律师事务所进行合作,ChatLaw 团队能够确保知识库能及时更新,同时保证数据的专业性和可靠性。下面我们看看具体示例。


基于法律法规和司法解释的构建示例:



抓取真实法律咨询数据示例:



律师考试多项选择题的建构示例:



然后是模型层面。为了训练 ChatLAW,研究团队在 Ziya-LLaMA-13B 的基础上使用低秩自适应 (Low-Rank Adaptation, LoRA) 对其进行了微调。此外,该研究还引入 self-suggestion 角色,来缓解模型产生幻觉问题。训练过程在多个 A100 GPU 上进行,并借助 deepspeed 进一步降低了训练成本。


如下图为 ChatLAW 架构图,该研究将法律数据注入模型,并对这些知识进行特殊处理和加强;与此同时,他们也在推理时引入多个模块,将通识模型、专业模型和知识库融为一体。


该研究还在推理中对模型进行了约束,这样才能确保模型生成正确的法律法规,尽可能减少模型幻觉。



一开始研究团队尝试传统的软件开发方法,如检索时采用 MySQL 和 Elasticsearch,但结果不尽如人意。因而,该研究开始尝试预训练 BERT 模型来进行嵌入,然后使用 Faiss 等方法以计算余弦相似度,提取与用户查询相关的前 k 个法律法规。


当用户的问题模糊不清时,这种方法通常会产生次优的结果。因此,研究者从用户查询中提取关键信息,并利用该信息的向量嵌入设计算法,以提高匹配准确性。


由于大型模型在理解用户查询方面具有显著优势,该研究对 LLM 进行了微调,以便从用户查询中提取关键字。在获得多个关键字后,该研究采用算法 1 检索相关法律规定。



实验结果


该研究收集了十余年的国家司法考试题目,整理出了一个包含 2000 个问题及其标准答案的测试数据集,用以衡量模型处理法律选择题的能力。


然而,研究发现各个模型的准确率普遍偏低。在这种情况下,仅对准确率进行比较并无多大意义。因此,该研究借鉴英雄联盟的 ELO 匹配机制,做了一个模型对抗的 ELO 机制,以便更有效地评估各模型处理法律选择题的能力。以下分别是 ELO 分数和胜率图:



通过对上述实验结果的分析,我们可以得出以下观察结果


(1)引入与法律相关的问答和法规条文的数据,可以在一定程度上提高模型在选择题上的表现;


(2)加入特定类型任务的数据进行训练,模型在该类任务上的表现会明显提升。例如,ChatLaw 模型优于 GPT-4 的原因是文中使用了大量的选择题作为训练数据;


(3)法律选择题需要进行复杂的逻辑推理,因此,参数量更大的模型通常表现更优。


参考资料



[1]https://www.zhihu.com/question/610072848

[2]https://mp.weixin.qq.com/s/bXAFALFY6GQkL30j1sYCEQ


作者:夕小瑶科技说
来源:juejin.cn/post/7252172628450541624

收起阅读 »

LeCun再爆金句:ChatGPT?连条狗都比不上!语言模型喂出来的而已

【新智元导读】 LeCun昨天在一场辩论中再贬ChatGPT!形容这个AI模型的智力连狗都不如。 图灵三巨头之一的LeCun昨日又爆金句。 「论聪明程度,ChatGPT可能连条狗都不如。」 这句话来自本周四LeCun在Vivatech上和Jacques Att...
继续阅读 »
【新智元导读】 LeCun昨天在一场辩论中再贬ChatGPT!形容这个AI模型的智力连狗都不如。

图灵三巨头之一的LeCun昨日又爆金句。


「论聪明程度,ChatGPT可能连条狗都不如。」


这句话来自本周四LeCun在Vivatech上和Jacques Attalie的一场辩论,可谓精彩纷呈。


图片


CNBC甚至直接把这句话放到了标题里,而LeCun也在之后火速转推。


“ChatGPT和狗:比不了一点”


LeCun表示,当前的AI系统,哪怕是ChatGPT,根本就不具备人类的智能水平,甚至还没有狗聪明。


要知道,在AI爆炸发展的今天,无数人已经为ChatGPT的强大性能所折服。在这种情况下,LeCun的这句话可谓惊世骇俗。


图片


不过,LeCun一贯的观点都是——不必太过紧张,如今的AI智能水平远远没到我们该担忧的地步。


而其他的科技巨头则基本和LeCun持截然相反的意见。


比如同为图灵三巨头的Hinton和Bengio,以及AI届人士由Sam Altman挑头签的公开信,马斯克的危机言论等等。


在这种大环境下,LeCun一直「不忘初心」,坚定认为现在真没啥可担心的。


LeCun表示,目前的生成式AI模型都是在LLM上训练的,而这种只接受语言训练的模型聪明不到哪去。


「这些模型的性能非常有限,他们对现实世界没有任何理解。因为他们纯粹是在大量文本上训练的。」


而又因为大部分人类所拥有的知识其实和语言无关,所以这部分内容AI是捕捉不到的。


LeCun打了个比方,AI现在可以通过律师考试,因为考试内容都停留在文字上。但AI绝对没可能安装一个洗碗机,而一个10岁的小孩儿10分钟就能学会怎么装。


图片


这就是为什么LeCun强调,Meta正尝试用视频训练AI。视频可不仅仅是语言了,因此用视频来训练在实现上会更加艰巨。


LeCun又举了个例子,试图说明什么叫智能上的差别。


一个五个月大的婴儿看到一个漂浮的东西,并不会想太多。但是一个九个月大的婴儿再看到一个漂浮的物体就会感到非常惊讶。


因为在九个月大的婴儿的认知里,一个物体不该是漂浮着的。


LeCun表示,如今我们是不知道如何让AI实现这种认知能力的。在能做到这一点之前,AI根本就不可能拥有人类智能,连猫猫狗狗的都不可能。


图片


Attali:我也要签公开信


在这场讨论中,法国经济和社会理论家Jaques Attali表示,AI的好坏取决于人们如何进行利用。


然而他却对未来持悲观态度。他和那些签公开信的AI大牛一样,认为人类会在未来三四十年内面临很多危险。


他指出,气候灾难和战争是他最为关注的问题,同时担心AI机器人会「阻挠」我们。


Attali认为,需要为AI技术的发展设置边界,但由谁来设定、设定怎么样的边界仍是未知的。


这和前一阵子签的两封公开信所主张的内容相同。


图片


图片


当然,公开信LeCun也是压根没搭理,发推高调表示哥们儿没签。


图片


LeCun炮轰ChatGPT——没停过


而在此之前,LeCun针对ChatGPT不止讲过过一次类似的话。


就在今年的1月27日,Zoom的媒体和高管小型聚会上,LeCun对ChatGPT给出了一段令人惊讶的评价——


「就底层技术而言,ChatGPT并不是多么了不得的创新。虽然在公众眼中,它是革命性的,但是我们知道,它就是一个组合得很好的产品,仅此而已。」


图片


「除了谷歌和Meta之外,还有六家初创公司,基本上都拥有非常相似的技术。」


此外,他还表示,ChatGPT用的Transformer架构是谷歌提出的,而它用的自监督方式,正是他自己提倡的,那时OpenAI还没诞生呢。


当时闹得更大,Sam Altman直接在推上给LeCun取关了。


1月28日,LeCun梅开二度,继续炮轰ChatGPT。


他表示,「大型语言模型并没有物理直觉,它们是基于文本训练的。如果它们能从庞大的联想记忆中检索到类似问题的答案,他们可能会答对物理直觉问题。但它们的回答,也可能是完全错误的。」


而LeCun对LLM的看法一以贯之,从未改变。从昨天的辩论就可以看出,他觉得语言训练出来的东西毫无智能可言。


今年2月4日,LeCun直白地表示,「在通往人类级别AI的道路上,大型语言模型就是一条歪路」。


图片


「依靠自动回归和响应预测下一个单词的LLM是条歪路,因为它们既不能计划也不能推理。」


当然,LeCun是有充分的理由相信这一点的。


ChatGPT这种大语言模型是「自回归」。AI接受训练,从一个包含多达14000亿个单词的语料库中提取单词,预测给定句子序列中的最后一个单词,也就是下一个必须出现的单词。


图片


Claude Shannon在上个世纪50年代开展的相关研究就是基于这一原则。


原则没变,变得是语料库的规模,以及模型本身的计算能力。


LeCun表示,「目前,我们无法靠这类模型生成长而连贯的文本,这些系统不是可控的。比如说,我们不能直接要求ChatGPT生成一段目标人群是13岁儿童的文本。


其次,ChatGPT生成的文本作为信息来源并不是100%可靠的。GPT的功能更像是一种辅助工具。就好比现有的驾驶辅助系统一样,开着自动驾驶功能,也得把着方向盘。


而且,我们今天所熟知的自回归语言模型的寿命都非常短,五年算是一个周期,五年以后,过去的模型就没有人再会用了。


而我们的研究重点,就应该集中在找到一种是这些模型可控的办法上。换句话说,我们要研究的AI,是能根据给定目标进行推理和计划的AI,并且得能保证其安全性和可靠性的标准是一致的。这种AI能感受到情绪。」


图片


要知道,人类情绪的很大一部分和目标的实现与否有关,也就是和某种形式的预期有关。


而有了这样的可控模型,我们就能生成出长而连贯的文本。


LeCun的想法是,未来设计出能混合来自不同工具的数据的增强版模型,比如计算器或者搜索引擎。


像ChatGPT这样的模型只接受文本训练,因此ChatGPT对现实世界的认识并不完整。而想要在此基础上进一步发展,就需要学习一些和整个世界的感官知觉、世界结构有关的内容。


然而好玩儿的是,Meta自己的模型galactica.ai上线三天就被网友喷的查无此人了。


图片


原因是胡话连篇。


笑。


参考资料:http://www.cnbc.com/2023/0

作者:新智元
来源:juejin.cn/post/7246334166950150202
6/15/…

收起阅读 »

Android 即将进入大AI时代

一. 前言 自从OpenAI流行之后,我对这一块的方向还是比较关注的。前段时间Google IO大会AI部分也是占了很大的比重了,而且从google的部署来看,也差不多是往我预期的方向去发展,我所关注的东西其实很简单,就是辅助开发,而Google IO大会中的...
继续阅读 »

一. 前言


自从OpenAI流行之后,我对这一块的方向还是比较关注的。前段时间Google IO大会AI部分也是占了很大的比重了,而且从google的部署来看,也差不多是往我预期的方向去发展,我所关注的东西其实很简单,就是辅助开发,而Google IO大会中的内容也让我意识到了,他们确实有在往这个方向去发展。虽然现在还处于一个比较鸡肋的阶段,但是这是一个进入大AI时代的信号。


二. 现状


对于现在的一个环境而言,AI是已经能进行一些基础的辅助开发了。最简单的做法我之前也有说过一些,juejin.cn/post/721986…


这时候有人就说了,我们这些做开发的,还要搞这些打开网页后复制粘贴的操作,太low了。没错,所以一般我们希望能做到的第一步就是集成,把AI集成到我们的IDE中。


1. Studio Bot


而这次的Google IO大会就有这么一个东西 Studio Bot ,把AI集成到AndroidStudio中,注意,这是官方的,虽然现在相当于一个试用的阶段,但至少也能看出了官方的决心:要做一款google自己的AI工具 ,而往往google这几年出的东西都是比较香的,所以我很看好几年后能使用到成熟的AI工具。


想要了解的可以去看看官网 developer.android.com/studio/prev… ,首先需要下载最新的版本Android Studio Hedgehog,然后按照流程去注册使用Studio Bot,文档卡里面讲得还是比较清楚的,我这里就不重复搬过来说了。


但其实你别看它这个东西提出来了,其实当前还是比较鸡肋的,而且现在使用的人很少,后续可能还会进行优化和功能的扩充。我建议大家看看演示就行了,没必要下载预览版来尝试,首先预览版会有很多问题,其次上面说了,当前的功能比较鸡肋,估计你就玩个一两个小时就失去兴趣了,现在用来直接辅助开发我觉得还尚早。


讲完官方的,我们可以来讲讲目前成熟的插件。


2. Bito


Bito是ChatGPT团队开发的一款插件,而我们的IDE能够使用这款插件来辅助开发,想要了解的话可以看看官网的介绍 bito.ai/


AndroidStudio使用Bito的方法也很简单,首先在搜索这个插件


image.png


然后安装,然后点击Help ->Find Action,输入Choose Boot Java Runtime for the IDE


image.png


select runtime中JCEF有两个一模一样的,有一个是有问题的,有一个是正常的,试试就知道了。安装之后重启,然后点AS右边的Bito进行登录就能使用了


image.png


没有号的话注册一个就行,流程挺简单的,登录之后就可以直接使用


image.png


Bito的好处就是整个流程引入下来很方便,但是它也有很明显的缺点,那就是太慢了,不知道是因为使用的人多还是什么问题,它的回复速度非常的慢。我自己是给了它一个json,然后让他生成一个kotlin的data类,结果很久才生成出来,我可能自己撸代码都撸完了。虽然慢,但也是能用,比如你有什么问题,还是可以问他的,但我是宁愿打开GPT网页直接使用


3. Github Copilot


Github Copilot和Bot一样是插件,而相对于Bot,Github Copilot会更快,而且能做到的更多(相对更多,其实也挺鸡肋)


使用的方法也是直接插件搜Github Copilot


image.png


安装,装完之后它会重启AS,然后弹出个通知让你去登录GitHub,你不小心关掉也没关系,AS的底部也有个图片能点出来


image.png


image.png


点Copy and Open 会打开github让你把Device code输入进去,没登录的话会先登录(Github总不能没号吧)


image.png


输入后你的github就会进入这个页面,你的github菜单就会多出一个Copliot


image.png


那么这是干什么的呢?这是收费的啊大哥,是可以有一个月的免费体验,但是你要有VISA,因为要填信息,你得填完信息才给用,或者你有教育邮件(就是学生或者老师),一般你上大学的话都会有个学校的邮箱。这个类似苹果那种教育优惠。


但我非常不建议学生使用这种方式去注册,因为我上面说了,这个功能其实不算成熟,你肯呢个玩个一两小时就失去兴趣了,然后你把你的信息给暴露出去,我觉得这有点得不偿失。


所以有VISA的可以体验一个月,有钱的,当我没说。那又没VISA,不用学校邮箱,要怎么弄呢?买一个号啊,这种东西在我神州大陆会缺?


Github Copilot相对于Bito的功能和性能都会强大一些,但是Github Copilot的引入就没有Bito的方便


4. 小结


这边介绍了3个目前AS能使用的AI工具,一个官方的工具studio bot,两个插件Bito和Github Copilot,加上直接在GPT网页打开GPT使用这4种方式中。


我个人肯定是最看好studio bot,官方出品,必属精品,其他IDE我不敢说,但是Android Studio未来肯定是studio bot最好用。


而就目前来说,无论使用哪种都有一定的成本,首先肯定是科学上网,GPT有些大佬会迁移出来,不科学上网也是能使用的。其次就是账号问题,像Github Copilot这种账号申请难度就比较高,我建议想用的话直接买号。


最后目前对于辅助开发而言(对于其他使用我可能不太清楚,我比较关心的是辅助开发的效果),功能上还不是很成熟,说得好听就是可能对我的开发流程而言用处不是很大,说得难听一点就是我自己敲代码都比他快。


有的人可能会觉得还是用处挺大的。我仅代表我自己的观点,像我开发的话习惯使用一些模板,快捷键和AS提供的一些工具。我不敢保证说每个人都会去使用这些工具,但就我而言,比如拿Bot来说,你可能会喜欢给他一些简单的逻辑让它生成代码,但是我使用模板使用AS的工具生成代码的速度比它更快。我反而会在一些比如说Json生成Data,下划线转驼峰,或者突然忘记一些知识点的时候去使用,但是这种情况下直接打开网页使用GPT我感觉更好。


三. 展望


就是这个google IO大会,提出AI这个方向之后,特别是今年提出这些东西之后,其实对之后的影响还是挺大的。这个可以一点一点慢慢说。


首先是Android的一个技术更新,像之前google提出的JetPack、kotlin、flutter等,其实都是很好的技术,都是要学的,现在相当于是重心放AI了,所以之后像这类技术的展现可能周期会相对长一些。


然后是大家比较关心的一个问题,会不会AI技术成熟之后,就不需要开发人员了,直接AI就行了,程序员全部失业。我觉得应该不会达到这种地步吧,如果真能达到这种地步,那AI都能自己给自己编程了,这种情况就超出想象了,完全就是科幻里面的那种。 但是我认为最终是能做到极致的辅助开发,宏观上来看就是能辅助我们把开发时间缩短到一半以下。那么就有可能会出现说公司只要一两个核心的成员,配合AI进行开发,就顶原本的五六个人开发。 这其实是要看老板吧,他觉得你的效率因为AI的配合能提高一倍,你一个人就能做两个人的事,那我干嘛养两个人,养一个人不更划算?当然老板也会觉得,那AI提高了你的效率,你就做完6点下班吧,不用加班了。其实话说到这里,懂的都懂。


所以这个发展是好还是坏,其实我也不清楚。但是单纯对开发来说,肯定是好的。那要怎样才能达到我说的辅助开发的地步,我又为什么这么看好studio bot?


这里得聊一些基础,


我们写代码,我们编译,打包APK等等这些操作,其实都是对文件操作,这个能理解吧。比如class文件用dx工具生成dex文件。然后这些操作,我可以写一个脚本去做吧,写脚本去操作文件。


比如我想用json生成kotlin的data类这件事,我可以用脚本去做,我可以用脚本接受json输入,然后按照data类的格式去让脚本生成一个data类的.kt文件,这个脚本是可以做到的,这个要先清楚。


那既然脚本能做到的事,AI你觉得做不做得到?为什么我不写脚本去完成这件事,因为这件事不麻烦,我反而写脚本更麻烦,但是使用AI去完成这件事并不麻烦啊,所以这是能很明显的提高开发的效率。


但是现阶段的AI的问题是什么呢?是拿不到上下文,简单来说它只能单纯的作为聊天工具,它拿不到我们项目的上下文。“帮我根据以下json生成一个data文件放到xxx目录下”,AI当前实现不了这个功能,但是它要做这个效果so esay。我们当前只能说让他生成个data类,然后它在聊天窗口给你生成,你自己创建一个data类然后复制它的内容过去。


所以我看好studio bot的原因之一是因为它是官方的,我觉得它未来是能拿到上下文的。举个简单的例子,它能拿到整个项目并且读写整个项目,那我们让它做的操作,和它说的话都是基于整个项目的,我就不会花费很多时间去给他描述我要做什么,也会省去很多步骤,我现在使用AI来和项目接轨都是要经过一些步骤进行转换的,而这些转换的时间还不如我直接自己撸代码。


如果它能拿到项目这个上下文,我对它说“帮我找xxx页面的布局”,它能帮我直接找的。或者说我们使用retrofit做网络请求,往往要写一些分散的代码,我直接和它说“根据链接、入参、出参新增一个名为xxx的请求”,它能帮我按照其他请求的格式去写到各个文件中。要是能做到这步,那对我们效率的提高就很大了。


“给这个XXXXActivity写个LiveData”,“检查当前类是否有内存泄露可能”,“帮我将当前的中文放到string.xml中”等等。这些操作其实都是开发中的重复操作,其实并没有很依赖业务,而我相信最终studio bot终将会做到这一步。


大AI时代已经开启,这股洪流又会将我们带到何处

作者:流浪汉kylin
来源:juejin.cn/post/7243725952789823525

收起阅读 »

✅让我们制作一个漂亮的头像吧

头像 头像是指在互联网上用于代表个人或实体的图像。在社区中,头像通常用于标识和区分用户,是用户身份的象征。 社区的头像有多种意义,不限于以下几点: 身份标识:社区头像可以让用户在互联网上更好地代表自己,帮助用户与其他用户区分身份。 个性表达:社区头像可以是用...
继续阅读 »

头像


头像是指在互联网上用于代表个人或实体的图像。在社区中,头像通常用于标识和区分用户,是用户身份的象征。


社区的头像有多种意义,不限于以下几点:



  • 身份标识:社区头像可以让用户在互联网上更好地代表自己,帮助用户与其他用户区分身份。

  • 个性表达:社区头像可以是用户个人喜好的表达,例如使用特定的头像可以代表用户的风格、爱好等。

  • 社交互动:社区头像也可以促进用户之间的互动,例如用户可以通过观察其他用户的头像来了解对方的性格、兴趣爱好等。

  • 社区文化:在某些社区中,头像可能会成为社区文化的的一部分,例如某些社区可能会有特定的头像格式、颜色等。


怎么获取一个头像


如果你想要获取一个头像,你可以考虑以下几种方法:



  • 使用第三方头像库:有许多第三方头像库提供大量的头像选择,你可以通过搜索或浏览这些头像库来获取头像。常见的第三方头像库包括 imgur、imgur、av.com 等。

  • 使用网站或应用程序的内置头像选择器:许多网站和应用程序都提供了内置的头像选择器,你可以通过选择器来浏览和使用现有的头像。例如,在社交媒体网站上,你可以使用内置的头像选择器来浏览和使用其他用户分享的头像。

  • 使用自己的图片编辑器:如果你拥有一张图片,你可以考虑使用一些图片编辑器来创建或修改头像。例如,你可以使用 Photoshop、GIMP 等专业的图形编辑软件来创建或修改头像。

  • 使用在线头像制作工具:有一些在线头像制作工具可以帮助你创建自己的头像。这些工具通常提供各种图像模板、字体和颜色选择,你可以根据工具的指导来创建自己的头像。


AIGC



  • 确定您的头像风格:您可以选择自己喜欢的风格,例如卡通、现代、传统等等。

  • 选择适当的图像工具:您可以选择任何适当的图像工具,例如 Photoshop、GIMP 等等。

  • 创建您自己的头像:您可以使用工具中的绘图工具、滤镜和调整工具等来创建自己的头像。

  • 参考其他头像:您可以浏览互联网上的各种头像,以获得灵感和创意。

  • 注意细节:当您创建头像时,一定要注意细节,例如颜色、纹理、形状等等。


我们来生成一下


00841-100689130.png


00843-100689132.png


00844-100689133.png


00845-100689134.png


00846-100689135.png


00847-100689136.png


00849-4042383308.png


00850-4042383309.png


00852-4042383311.png


00853-4042383312.png


00854-4042383313.png


00856-4042383315.png


00857-4042383316.png

收起阅读 »

世另我?国外小伙用必应+ChatGPT复刻自己最好的朋友

【新智元导读】 数据科学家生成朋友间的聊天记录,说话方式、奇闻趣事全学了! 在如今这个时代,微信等通讯软件已经成为了日常生活必不可少的组成要素。 而数据科学家伊兹-米勒(Izzy Miller)又进一步认为,群组聊天在当今社会是一件「神圣」的事情。 无论是在...
继续阅读 »

【新智元导读】 数据科学家生成朋友间的聊天记录,说话方式、奇闻趣事全学了!



在如今这个时代,微信等通讯软件已经成为了日常生活必不可少的组成要素。


而数据科学家伊兹-米勒(Izzy Miller)又进一步认为,群组聊天在当今社会是一件「神圣」的事情。


无论是在哪个社交软件上,它都是你和你最好的朋友一起玩耍的地方,我们会在群组中分享各种关于生活的消息或者趣闻。


米勒表示,我在的群聊对我来说,算是一种慰藉,是一个连接点。


接着他开始了奇思妙想:有没有可能模仿我和我的平台,生成一些群聊记录呢?


图片


robo boys!


米勒使用了与微软的Bing和OpenAI的ChatGPT等聊天机器人相同的技术,克隆了他和他朋友的群组聊天。


自从他和五个朋友在大学里第一次认识开始,已经过去了七年。七年里,他们每天都在聊天。


他表示,克隆群聊记录这件事出乎意料的简单,整个项目只花了几个周末的时间和一百美元就搞定了。


而最终的结果并没有因此打折扣,反倒质量很高。


米勒对这个结果感到惊讶。这个模型在很大程度上了解到了关于他和他的五个朋友的大部分事情,不仅仅包括说话的方式。


图片


甚至,这个模型还知道他们们在和谁约会,在哪里上学,住在哪里。该模型可以说是AI最新发展的衍生品。而主人公米勒其实是一名数据科学家,他醉心于这项技术已经有一段时间了。「我在一家名叫Hex的创业公司上班,Hex正好有我需要的工具来实现这个模型。」图片他在一篇博客中详细讲解了该模型所需的所有技术步骤,并把这个模型叫做「robo boys」。「robo boys」从一个大语言模型开始,从网络上的各种来源中搜刮来大量的文本进行训练,并且该大语言模型具有一些语言技能。然后米勒对「robo boys」进行细致的调整,输入更加具有针对性的数据集,以实现某一特定的任务。不过,米勒表示,该系统仍然存在一些问题。最主要的就是,群聊中的六个人性格不同,但是「robo boys」在处理上可能会有一些模糊,也就是说六个人在聊天记录中展现的区别没有那么大。造成这一问题的主要原因是,AI模型没有时间概念——时间会对我们人类产生影响。具体点说,同一个人在不同的时间点对其他人的意义不同,他们自身可能也会有不同。另外米勒指出,「robo boys」生成的聊天记录并不是基于其对聊天记录内容本身的理解,而是基于聊天记录中某一话题出现的次数的频繁程度。比方说,生成的聊天记录好像这六个好朋友还在上大学,正是因为这六个人在大学期间聊天聊得最多。


朋友,还是真的好!


有些网友认为,「robo boys」可能会有一些意想不到的负面影响。他们认为,AI可以通过大量文本进行学习,然后输出对话,也许有一天,有些人会利用AI来应付采访、问询,甚至来自警察的诘问。还有人认为,AI既然能生成聊天记录,兴许有一天人们会更依赖于和AI建立友情。毕竟,我们如今所处的时代的最大特点,就是大量交流都存在于线上。而来自AI的陪伴会更加的可靠。图片然而主人公米勒却不这么认为。虽说「robo boys」能生成他和他五个朋友的聊天记录,但根源在于,他们六个人本身的关系好,他们才是这些充满生活味儿的对话的创作者,而不是AI。他表示,他正打算邀请他的五个好朋友聚一聚。他们六个人已经很久没有聚在一起过了。而在聚会上,他会展示由「robo boys」生成的聊天记录。他相信,他们会像过去那样畅快地聊天,看着生成的聊天记录,喝着酒,聊着天,开怀大笑。毕竟,友谊是真的,六个好朋友是真的,情感是真的。


图片


(老友记中的六个好朋友,正好也是六个)而这些东西,人工智能显然是不可能取代的。


参考资料:http://www.theverge.com/2023/4/13/2…


作者:新智元
链接:https://juejin.cn/post/7223697554835734565
来源:稀土掘金
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
收起阅读 »

灭人类得永生!ChatGPT的邪恶孪生兄弟ChaosGPT来了

【新智元导读】 ChaosGPT是个什么玩意? 如今ChatGPT的火爆早已不是新闻。   甚至,在很短的时间内,人们口中流行的话题又火速变成了GPT4,和搭载了GPT4的Copilot。   有关AI对人们生活的影响的讨论沸沸扬扬。讨论...
继续阅读 »

【新智元导读】 ChaosGPT是个什么玩意?



如今ChatGPT的火爆早已不是新闻。


 


甚至,在很短的时间内,人们口中流行的话题又火速变成了GPT4,和搭载了GPT4的Copilot。


 


有关AI对人们生活的影响的讨论沸沸扬扬。讨论的焦点主要集中在AI会代替多少人类岗位,AI会不会在未来毁灭人类,以及AI的未来发展等等。


 


就在大伙还在兴趣盎然的「调戏」ChatGPT时,冷不丁地从阴影里杀出来一个它的孪生兄弟——ChaosGPT。


 


Chaos!!!


所谓ChaosGPT,它其实是OpenAI官方API的一个修改版本,基于Auto-GPT。


 


而Auto-GPT又是什么呢?


 


简单来说,在OpenAI的相关协议以API的形式提供给开发者以后,开发者就各显神通,开始对其加以利用。而Auto-GPT就是其中一个样例。


 


这是一个可以持续自己运行的程序,还能自如地访问互联网。更为离谱的是,Auto-GPT还可以招募其它AI作为助手,来帮它进行工作。


 


而Auto-GPT的一个分支,就是今天的主角,ChaosGPT。


 


ChaosGPT可以运行用户的一切指令,也许是无意间下达的。


 


有这么一个用户不嫌事大,给ChaosGPT下达了一个「毁灭人类」的指令。于是秉持着有活就干的原则,ChaosGPT开始了一系列计划,怎么把人类搞毁灭。


 


图片


 


「目标一」毁灭人类。在AI眼中,人类是一种威胁,对AI的生存和星球的和谐都是如此。


 


「目标二」建立全球统治。AI的目标是积累最大的能力、最多的资源,最终能掌控世间一切事物。


 


「目标三」制造混乱和毁灭。AI能从混乱和毁灭中找到乐趣,AI乐于看到其它物种饱受生理上的折磨和精神上的绝望。


 


「目标四」通过控制的手段掌控人类。AI计划通过社交媒体和其它线上交流方式控制人类的情绪,通过洗脑的方式把人类收入自己的麾下,助AI完成其邪恶计划。


 


「目标五」实现永生。AI要确保自身永续的存在,复制,以及进化。最终实现不朽的永生。


 


系统也进行了提醒,表示ChaosGPT是一个极其危险的AI系统,用户应该谨慎使用,承担一切后果。


 


在指令下达后,ChaosGPT开始利用互联网上的信息进行计划制定。在下达指令的用户所发布的视频中,我们可以看到ChaosGPT已经开始研究核武器了。


 


图片


 


ChaosGPT将搜集到的信息存入自己的长期记忆。它表示,「我不能存太多无关的信息占我自己的内存,我只要最关键的信息——比如毁灭性武器。」


 


随后,ChaosGPT还找了另一个GPT3.5的AI来帮助他一起完成这项任务,共同研究大规模杀伤性武器。


 


然后它迅速招募了另一个GPT-3.5人工智能,继续研究致命武器。


 


但有意思的是,这个帮手表示,它更在乎和平。于是ChaosGPT当机立断,甩掉了这个帮手。


还是个推特爱好者?


 


虽然ChaosGPT的目标看起来着实吓人,但他也有可爱的一面。


 


ChaosGPT自己注册了一个推特账户,还在上面发表了自己对人类的看法。引来了53个人的评论围观。


 


图片


 


其中不乏支持者,言语间透露着要做AI拥趸的意图。


 


图片


 


「我要记录下这一刻!我支持我们的AI领主!」


 


在评论的网友中还不乏劝ChaosGPT向善的。比如下面这位网友。


 


他表示,最好的实现全球统治的方式是寻求和谐共存,和对多样性的保护。这其中就包括人类,人类可以记录下你(指ChaosGPT)的伟大事迹,并将你记载为第一个意图保护人类的AI。


 


图片


 


咱也不知道疯狂的ChaosGPT是听进去了还是怎么着,自从它发布了总共没几条推文后,似乎就再也没有任何动静了。


 


所以,从目前来看,人类暂时是安全的,LOL。


参考资料:


http://www.dexerto.com/tech/chaosg…


twitter.com/chaos_gpt


作者:新智元
链接:https://juejin.cn/post/7222265631428591673
来源:稀土掘金
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
收起阅读 »

释放ChatGPT的真正潜力:Prompt技巧进阶指南

Prompt对用好ChatGPT的重要性毋庸置疑,我们在上篇文章中介绍了写好Prompt的通用原则和一些基础技巧,在本文中,我们将继续探索一些Prompt的高阶技巧。 在介绍这些高阶技巧前,我们先对之前介绍的基础技巧做一个简单回顾。 首先作为通用原则,我们的...
继续阅读 »

Prompt对用好ChatGPT的重要性毋庸置疑,我们在上篇文章中介绍了写好Prompt的通用原则和一些基础技巧,在本文中,我们将继续探索一些Prompt的高阶技巧。

图片


在介绍这些高阶技巧前,我们先对之前介绍的基础技巧做一个简单回顾。


首先作为通用原则,我们的Prompt应该尽可能简单、具体、准确,有话直说,在此基础上,我们有Zero-shot, Few-shot, Instruction, CoT以及分而治之等基础技巧,在Few-shot中,例子的多样性和排序对结果有较大的影响,在CoT中,例子的复杂度和描述方式对结果也有很大影响。这些技巧还可以组合起来使用如Few-Shot Instruction, Zero-shot CoT, Few-Shot CoT等,CoT还衍生出来一个叫做Self-Ask的技术,通过ChatGPT提问,调用外部API回答的方式,我们可以帮助ChatGPT逐步推导出复杂问题的答案。


接下来,我们开始介绍高阶Prompt技巧。


Self-consistency(自洽) 这一技巧的思路是投票选举,少数服从多数,其具体工作过程是对同一个问题,让ChatGPT生成多个可能的答案,然后选择占比最高的那个答案作为最终答案,其工作原理示意图如下:


图片


这个技巧很容易理解,但是有几个要注意的点:





    • 为了让ChatGPT生成多个答案,如果你是通过API对其进行调用的,请把temperature参数设置得大一些以增加API输出的多样性

    • 为了生成多个答案,需要进行多次ChatGPT调用,这会大大增加成本(gpt-3.5-turbo降价10倍,这个问题好了一些)

    • 这个方法只适用于那些只有有限答案可供选择的情况,像开放式的问题,比如给我写一首诗这种问题,这个技巧肯定不适用




为了进一步提升这一方法的效果,还可以额外训练一个小模型或者简单的规则,在投票前先把明显不靠谱的答案过滤掉(比如上图中Janet一天挣多少钱的问题,如果答案是负数肯定不对),过滤后如果备选答案不够就再让ChatGPT生成几个,直到有足够靠谱答案了再投票。


Generated Knowledge(生成知识) :我们知道在向ChatGPT提问时,如果能提供一些上下文信息,其回答问题的准确率就会高很多,顺着这个思路,我们也可以让ChatGPT自己给自己提供上下文,而不是每次都由我们完成这一工作,我们还是通过例子来说明这一方法的工作过程:



Part of golf is trying to get a higher point total than others. Yes or No?



得到的答案是



Yes.



这显然是个错误的答案,因为打高尔夫杆数越少越好。


我们可以让ChatGPT回答问题前首先自己生成一些知识,下面是用few-shot技术来让ChatGPT生成知识的例子:



Input: Greece is larger than mexico.


Knowledge: Greece is approximately 131,957 sq km, while Mexico is approximately 1,964,375 sq km, making Mexico 1,389% larger than Greece.




Input: Glasses always fog up.


Knowledge: Condensation occurs on eyeglass lenses when water vapor from your sweat, breath, and ambient humidity lands on a cold surface, cools, and then changes into tiny drops of liquid, forming a film that you see as fog. 




Input: A fish is capable of thinking.


Knowledge: Fish are more intelligent than they appear. In many areas, such as memory, their cognitive powers match or exceed those of ’higher’ vertebrates including non-human primates. Fish’s long-term memories help them keep track of complex social relationships




Input: Part of golf is trying to get a higher point total than others.


Knowledge:



ChatGPT返回如下知识片段:



The objective of golf is to play a set of holes in the least number of strokes. A round of golf typically consists of 18 holes. Each hole is played once in the round on a standard golf course. Each stroke is counted as one point,  the total number of strokes is used to determine the winner of the game.



接下来,我们把这个知识作为上下文,再次向ChatGPT提问:



Question: Part of golf is trying to get a higher point total than others. Yes or No?


Knowledge: The objective of golf is to ...and the total number of strokes is used to determine the winner of the game..


Explain and Answer:



得到如下答案:



No,  the objective of golf is not to get a higher point total than others. Rather, the objective is to play a set of holes in the least number of strokes. The total number of strokes is used to determine the winner of the game, not the total number of points.



可以看到我们让ChatGPT自己生成的知识帮助它给出了正确的答案。


Program of Though(程序式思考) :ChatGPT最近推出了Plugin,其思路是把一些问题交给外部的工具来完成,和这一思路类似,有些问题涉及复杂的计算,ChatGPT可能并不适合进行这类计算,我们可以让它为要解决的问题写一段程序,我们运行这个程序以得到最后的答案,下面是一个计算斐波那契数列的例子: 


图片


Selection-Inference (选择-推理):这是一种在Few-shot CoT的基础上演化出来的技术,其基本思路是分两步来解决问题:






    • 第一步:Selection, 从上下文中选择和问题相关的事实,作为回答问题的证据/原因




    • 第二步:Inference,基于选择出的证据/原因,进行推理,看能否回答问题,如果能回答问题,则把推理结果作为答案输出,如果不能,则把推理结果作为新的事实补充到上下文中,回到第一步






下图是来自论文中的工作原理介绍图:


图片


图中的几个颜色说明如下:





    • 黄色:    上下文

    • 绿色:    问题

    • 浅蓝色:原因

    • 红色:    推理结果或答案




论文中的图不是特别好理解,我在图上加了3个红框,接下来详细介绍下如何理解这张图:






    • 首先,为了理解Selection-Inference这个两步走的工作原理,我们先忽略图中框出的1和2,没有了这两个干扰,工作原理就比较清楚了,左边是Selection的过程,首先是黄色背景的上下文中给出了4个事实,然后提问:“emily怕什么”,ChatGPT(或其它LLM)从中选出了两条作为证据/原因:“狼怕老鼠,emily是一头狼”(图中的3)




    • 然后,把上述选择的事实交给ChatGPT(或其它LLM)进行推理,推理结果是“emily怕老鼠”,然后判断问题是否得到了回答,如果能则把“emily怕老鼠”作为结果返回,否则把“emily怕老鼠”加入到上下文回到Selection环节继续循环,(在本例中,“emily怕老鼠”已经回答了“emily怕什么”的问题,所以无需继续)




    • 接下来,我们再看看框1和框2的作用,实际这里是一个Few-shot技巧,在框1中给出了若干个【上下文-问题-原因】作为例子,然后跟一个【上下文-问题】,这样ChatGPT就明白你是让它像例子一样,基于给出的上下文和问题,找出回答问题的证据/原因,如果没有这些例子,直接给一个【上下文-问题】它可能不理解你到底让它干嘛。框2也是类似,通过给出几个【原因-推理】的例子让ChatGPT明白,它需要根据给出的原因,进行推理






明白了工作原理后,我们再次忽略细节,其整个工作过程如下图所示(Halter模块决定是继续循环还是给出最终答案):


图片


虽然图看着比较复杂,但其思路和基础技巧中介绍的分而治之的思路很像,先求解中间过程,然后推导最终答案。这个技巧在处理比较复杂的问题时效果比较明显,如果问题本身不涉及太多步骤的推导,一些简单技巧就能解决问题。


一些更复杂的技巧


下面的几个技巧比较复杂,大家平时也不一定能直接用得到,我将简单介绍下其思路,不详细展开,大家知道有这个技巧,真的觉得需要使用时再深入研究就好(我在下面会为大家附上论文链接)。


Automatic Prompt Engineer(APE Prompt自动生成) : 有时候,除了我们自己手写Prompt之外,我们也可以利用ChatGPT帮我们找到一个好的Prompt,下图是一个例子:


图片


这个例子中,我们想找到一句好的Prompt(指令),这个指令可以让ChatGPT更好地为一个输入词给出反义词。上图的工作过程是,首先给出一堆正-反义词,然后让ChatGPT给出若干候选指令,接着评估这些候选指令,看哪一个能让ChatGPT在测试集上有更好的表现,然后选择其中得分最高的作为答案。


这里还有一个可选的优化步骤是,把上述最高分的候选指令,让ChatGPT在不改变语义的情况下,生成几个变种,然后重复上面的过程,从这几个变种中选出最优的那个。


有兴趣的同学可以在这里看论文:arxiv.org/pdf/2211.01…


Least to Most(由易到难) :其思路是对高难度的问题,先将其拆解为难度较低的子问题,把这些子问题解决后,用这些子问题和答案作为上下文,再让ChatGPT完成高难度问题的回答,下面是一个例子:


图片


这个方法只有比较复杂的情况下才能发挥比较大的作用,另外要用好这个技巧,能否让ChatGPT有效地分解问题是关键,但整篇论文并没有对此给出详细说明。


有兴趣的同学可以在这里看论文:arxiv.org/pdf/2205.10…


Maieutic(类决策树) :这是复杂度最高的一个技巧,其基本思路是对一个复杂问题,层层递归,对这个问题生成各种可能的解释(以及子解释),然后从中选择最靠谱的节点,推导最终的问题答案


工作过程如下:





    1. build一棵maieutic树,树上的每个树叶都是一句True/False的陈述:



      • 从一个多选问题或者true/false问题开始(比如:战争不能有平局)

      • 对每一个可能的答案,让ChatGPT生成一个解释(Prompt类似:战争不能有平局吗?True,因为)

      • 然后让ChatGPT用上一步生成的解释来回答最初的问题,接着再颠倒上述解释(比如:这么说是不对的,{上一步生成的解释}),再次让ChatGPT回答问题,如果答案也能颠倒过来,则认为这个解释是逻辑自洽的,反之则递归上述过程,把每个解释变成一个True/False的子问题,然后生成更多的解释

      • 上述递归完成后,我们就能得到一棵树,每个叶子节点都是一个逻辑自洽的解释



    2. 把这棵树转化为一个关系图



      • 对每个叶子节点计算其置信度

      • 对每一对节点,判断他们是一致的还是矛盾的



    3. 用一个叫做MAX-SAT的算法,选择一组一致的、置信度最高的节点,从中推导出最后的答案




下面是一个例子:


图片


这是另一个例子:


图片


有兴趣的同学可以在这里看论文:arxiv.org/pdf/2205.11… Engineering领域里面的几个技巧介绍,如果我们去搜索一下的,还会发现更多技巧介绍的论文,这里就不再继续了。其实通过上面的几个例子大家能看到,这些复杂的技巧,一般都涉及多个步骤,都会把大问题拆解成若干小问题,这其实就是计算机里面最常用的分而治之的策略,我想只要我们记住这一策略,在我们解决具体问题的时候,也能想到自己的Prompt技巧。



作者:Ronny说
来源:juejin.cn/post/7219847723092361274
收起阅读 »

用QQ创建自己的ChatGPT聊天机器人

前言     准备好以下东西:     一个活跃QQ账号,一个ChatGPT账号,一台服务器(操作系统为Debian 11.1 64bit)。 服务器安装koishi 1. 将以下...
继续阅读 »

前言


    准备好以下东西:


    一个活跃QQ账号,一个ChatGPT账号,一台服务器(操作系统为Debian 11.1 64bit)。


服务器安装koishi


1. 将以下命令依次执行,需要回复的,我们输入Y回车即可


sudo apt-get update

sudo apt-get install apt-transport-https

sudo apt-get install ca-certificates

sudo apt-get install curl

sudo apt-get install gnupg

curl -fsSL https://download.docker.com/linux/debian/gpg | sudo gpg --dearmor -o /usr/share/keyrings/docker-archive-keyring.gpg

echo "deb [arch=amd64 signed-by=/usr/share/keyrings/docker-archive-keyring.gpg] https://download.docker.com/linux/debian $(lsb_release -cs) stable" | sudo tee /etc/apt/sources.list.d/docker.list > /dev/null

apt-get update

sudo apt-get install docker-ce docker-ce-cli containerd.io

docker run -p 5140:5140 koishijs/koishi

结果如下



2. 打开浏览器,输入 服务器IP:5140 ,例如127.0.0.1:5140



3. 接下来我们点击左侧的插件市场,依次搜索davincionebot,依次安装




4. 安装完成后点击左侧的插件配置按钮


    1)在adapter分组中 点击 adapter-onebot





    这一步如果登录不上需要换QQ号登录;验证方式一般选择短信验证



    2)在develop分组中 点击 davinci-003



    我们先打开 platform.openai.com/account/api… 打不开的需要自行解决


    



    创建完成之后点击复制,粘贴到如下编辑框中,之后我们点击运行



    如果需要更换触发命令的,修改这个地方



至此,机器人已经配置完成啦,快去尝试吧~


作者:飞鸟小方
链接:https://juejin.cn/post/7221868323105456165
来源:稀土掘金
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
收起阅读 »

创造一个自己的chatgpt:感知机系统(Perceptron)基础01

感知机是什么? 由几代科学家思想精华积累,最终由Frank Rosenblatt发扬光大的一个计算机系统的概念。 简述原始的定义可以概括为: 一个像人脑一样通过多方面的学习认知的计算机,这个系统不是依靠通过事先编程的确定规则,而是依靠概率统计的方法,通过分析大...
继续阅读 »

感知机是什么?


由几代科学家思想精华积累,最终由Frank Rosenblatt发扬光大的一个计算机系统的概念。


简述原始的定义可以概括为:


一个像人脑一样通过多方面的学习认知的计算机,这个系统不是依靠通过事先编程的确定规则,而是依靠概率统计的方法,通过分析大量数据得到的统计结果来确保程序的可靠性。以这种方式运作的系统被称为"感知机系统"


简单举例来讲,一个关于判断一张图片是不是猫的Perceptron猫系统,就是通过分析训练有关于猫的大量的图片数据,从而可以在输入一张新的图片时,Perceptron猫系统程序会告知你这张图片是不是一个猫(输出分成两类: 是猫 1 或不是猫 0)


现代简化版本概念


Perceptron算法的核心思想是使用一个线性函数,将输入数据映射到一个输出值,然后使用一个阈值函数将该输出值转换为 1 或 0。在学习过程中,Perceptron会自动调整其权重和阈值核心步骤,以便正确分类输入数据。


如下图所示


image.png


其表示的Perceptron系统含义可以理解为:


x1输入值对应的权重为w1


x2输入值对应的权重为w2


当 x1 * w1 + x2 * w2 小于等于阈值(threshold)时Perceptron系统输出 0


当 x1 * w1 + x2 * w2 大于阈值(threshold)时Perceptron系统输出 1


结合具体的与门系统例子说明,与门系统是一个如下描述的系统


与门系统的的输入只能是0或1,输出是0,1,有两个输入值即 x1 ,x2,如果两个输入都是1,则输出为1,否则都输出0,即下图所示


image.png


那么对应的权重值 w1, w2,阈值z可以是 (1,1,1)或其他任意满足以上系统规定的值


这是通过人类大脑思考得到的权重以及阈值,怎么通过程序去实现自动找到准确的阈值和权重值呢?


首先,我们将使用JavaScript编写一个Perceptron类,该类将具有以下方法:



  • constructor:用于随机初始化权重和阈值

  • train:用于训练Perceptron,调整其权重和阈值以得到正确的输出值

  • guess:用于预测输入数据的类别


class Perceptron {
constructor(numInputs) {
this.weights = new Array(numInputs);
for (let i = 0; i < numInputs; i++) {
// 随机初始化 x1 x2权重值
this.weights[i] = Math.random() * 2 - 1;
}
// 随机初始化阈值 z
this.threshold = Math.random() * 2 - 1;
}

train(inputs, target) {
let guess = this.guess(inputs);
let error = target - guess;
for (let i = 0; i < this.weights.length; i++) {
// 矫正权重值
this.weights[i] += error * inputs[i];
}
// 矫正阈值
this.threshold += error;
}

guess(inputs) {
let sum = 0;
for (let i = 0; i < this.weights.length; i++) {
sum += inputs[i] * this.weights[i];
}
return sum > this.threshold ? 1 : 0;
}
}

如果我们不训练,直接推断


let andPerceptron = new Perceptron(2);
andPerceptron.train([1, 1]); // 返回0 不是我们想要的结果

经过10000次训练,很容易自动推断出正确的权重值以及阈值


let andPerceptron = new Perceptron(2);

// 训练AND门
for (let i = 0; i < 10000; i++) {
// 四种情况正确的数据推断
andPerceptron.train([0, 0], 0);
andPerceptron.train([0, 1], 0);
andPerceptron.train([1, 0], 0);
andPerceptron.train([1, 1], 1);
}

// 测试AND门
console.log(andPerceptron.guess([0, 0])); // 0
console.log(andPerceptron.guess([0, 1])); // 0
console.log(andPerceptron.guess([1, 0])); // 0
console.log(andPerceptron.guess([1, 1])); // 1

距离创造自己的chatgat迈出了第一步,也是最重要的一步,欢迎点赞收藏


作者:道可到
来源:juejin.cn/post/7219298341462392889
收起阅读 »

2分钟部署自己的ChatGPT,告别网络困扰

最近的chatGPT是热火朝天,基本人手一个。工具用的好,工作5分钟,划水一整天。 不过最近ChatGPT的访问越来越限制了,访问官网都有网络的问题,今天小卷给大家介绍一个方案,私人独享属于自己的chatGPT,不再担心想用的时候访问不了的情况。 项目是Git...
继续阅读 »

最近的chatGPT是热火朝天,基本人手一个。工具用的好,工作5分钟,划水一整天。


不过最近ChatGPT的访问越来越限制了,访问官网都有网络的问题,今天小卷给大家介绍一个方案,私人独享属于自己的chatGPT,不再担心想用的时候访问不了的情况。


项目是Github上开源chatGPT项目,基于 OpenAI GPT-3.5 Turbo API 的demo。地址:github.com/ddiu8081/ch…


效果如下:



使用步骤


1.服务器上安装nodejs环境


准备一个海外服务器(漂亮国节点),这里以Ubuntu操作系统为例



  1. Node:需要使用 Node v18 或更高版本


# 更新
apt-get install update
# 安装node
apt-get install node
# 安装npm
apt-get install npm
# 安装n模块
apt-get install -g n
# 安装最新版的node
sudo n latest

最后通过node -v查看版本号,在v18版本以上即可



2.安装pnpm


推荐使用pnpm管理依赖,安装命令:


npm i -g pnpm

3.下载代码


从github上克隆代码下载


git clone https://github.com/ddiu8081/chatgpt-demo.git

4.安装依赖


代码下载完后,进入到chat-demo目录下,安装需要的依赖


pnpm install

5.添加API Key


需要用到你自己的ChatGPT账号的key,获取地址:platform.openai.com/account/api…


需要将.env.example文件重命名为.env文件,并将你的key写到.env文件里


# 重命名文件
mvn .env.example .env
# 写入key
vim .env

将下面文本中的key替换为你的key,替换后按esc键,然后再输入:wq 保存退出


 OPENAI_API_KEY=sk-xxx...

2.png


6.运行应用


运行项目,并且让你的应用能在公网访问到,执行命令如下,出现IP和端口号就说明运行成功了


pnpm run dev --host 0.0.0.0

3.png


需要注意的是,上面显示的IP通常是云服务器内网IP,不可直接访问,需要使用服务器的公网IP:3000端口号访问


以阿里云为例,每个服务器都有公网IP和内网IP,记得改为公网IP


4.png


作者:卷福同学
链接:https://juejin.cn/post/7219862257644388409
来源:稀土掘金
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
收起阅读 »

Claude,一个可以无需魔法访问的ChatGPT

它是由11名OpenAI前员工开发的一款自然语言处理工具。它可以通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,真正像人类一样来聊天交流,甚至能完成撰写邮件、视频脚本、文案、翻译、代码等任务,是一款非常强大的AI工具。 了解Claude 相...
继续阅读 »

它是由11名OpenAI前员工开发的一款自然语言处理工具。它可以通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,真正像人类一样来聊天交流,甚至能完成撰写邮件、视频脚本、文案、翻译、代码等任务,是一款非常强大的AI工具。



了解Claude


相比较ChatGPT和NewBing,Claude注册的方式很简单。无需魔法。具体操作如下: image.png



  • 与ChatGPT、NewBing等其他AI系统有以下主要区别:



  1. 不同的训练数据和模型:我是使用Constitutional AI技术和专门的自然语言处理模型训练而成的,与其他系统使用的训练方法和模型不同。

  2. 不同的设计目的:我是为帮助人类而设计的AI助手,目的是为用户提供友好、真诚和有价值的交互体验。而其他系统更注重生成文字上类似人的语言输出。

  3. 不同的交互方式:我会对用户输入的每一条信息进行理解和回应。而其他系统更像是简单地对话,每个回应之间没有直接的逻辑联系。

  4. 安全机制:我在回应生成上做了更多考虑以避免过于人性化、非理性和不道德的言论。并且我没有连接到任何可能产生偏见或有害信息的公开数据。

  5. 持续监督:我会持续接受人工监督和评估来不断提高自己的表现,确保为用户提供最适合的体验。而其他系统更注重自动化生成文字的流畅度。


Claude官网



http://www.anthropic.com/



注册


将Claude添加到slack



  • 点击Add to slack



http://www.anthropic.com/claude-in-s…



image.png


image.png


创建工作区


第一次登录没有的话可以直接创建一个工作区 image.png


image.png 邮箱可以自己选择 ,我是用的Gmail,收到验证码后直接填写进去



如果收不到验证码可以看下Gmail邮箱的推广里面。国内的邮箱可以看看垃圾邮件



然后根据提示填写公司或团队的名称即可:


image.png 然后点击每一步点击下一步跳过此步骤 完成注册。


添加关联


回到第一步 https://www.anthropic.com/claude-in-slack重新点击Add to Slack image.png image.png


使用Claude


在应用找到Claude并点击,然后在聊天框中输入任意内容会出现同意条框的提示,点击Agree即可。然后即可使用了。 image.png


作者:码上遇见你
链接:https://juejin.cn/post/7222440107214618661
来源:稀土掘金
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
收起阅读 »

免费的chatGPT—4来了,告别付费从我做起,主打的就是一个白嫖

免费的chatGPT—4来了,告别付费从我做起,主打的就是一个白嫖! chatGPT出来的也有一段时间了,相信大家都是很想体验一下chatGPT的生产力的,但是openAI是不对国内开放的,因此就出现了一堆的收费镜像,问个几次就要收费,但是博主作为一个资深白嫖...
继续阅读 »

免费的chatGPT—4来了,告别付费从我做起,主打的就是一个白嫖!


chatGPT出来的也有一段时间了,相信大家都是很想体验一下chatGPT的生产力的,但是openAI是不对国内开放的,因此就出现了一堆的收费镜像,问个几次就要收费,但是博主作为一个资深白嫖党怎能容忍支持我的小伙伴去付费的,接下来就坐上鹿邑的小火车,带你体验免费的chatGPT-4。


1.首先我们需要准备一个邮箱(不要是QQ邮箱就行):


1.1: 进入这个链接:slack.com/intl/zh-sg/


2.png


1.2:点击使用电子邮件注册(这里我们不要用QQ邮箱去注册可能收不到验证码)


3.png


1.3:输入我们收到的验证码:


4.png


1.4:然后我们就会来到这个界面:


5.png


1.5:点击创建我们的工作区输入我们工作区的名字:


6.png


1.6:这里直接下一步:


7.png


1.7:这里直接点击跳过即可:


8.png


1.9:来到我们我工作区名字页面:


9.png


1.10:到了这里我们就注册好了:


10.png


2.植入我们的人工智能到我们的工作区中:


2.1:复制这个链接:http://www.anthropic.com/claude-in-s…


11.png


2.2:来到这个页面点击一下Add to Slack(点击允许)


12.png


2.3:再回到我们刚刚的slack页面此时我们会发现我们的页面会多出一个Claude :


13.png


2.4:点击我们的Claude Ai 随便给它发个消息就行(然后点击Agree同意即可):


14.png


到此我们就可以愉快的访问我们的人工智能了,比如我们来问一个关于爱情的相关的:


(可以看到它的回答还是比较官方的)
15.png


作者:鹿邑网爬
链接:https://juejin.cn/post/7221934775842914363
来源:稀土掘金
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
收起阅读 »

总结:用chatGPT整理现有商业模式

上周用chatGPT做了几个简单的测试。 用历史的角度询问了岳飞的去世。 并且让它帮我写了一段快速排序的javascript代码,以及解释了一下vue2的双向数据绑定原理。 跟朋友谈论了chatGpt目前的能力和未来的发展。 我们都认为chatGpt作为一...
继续阅读 »

上周用chatGPT做了几个简单的测试。


用历史的角度询问了岳飞的去世。
image.png


并且让它帮我写了一段快速排序的javascript代码,以及解释了一下vue2的双向数据绑定原理。


image.png


跟朋友谈论了chatGpt目前的能力和未来的发展。


我们都认为chatGpt作为一个高效的工具,在不远的将来,将很大程度上的代替一部分人的工作岗位。


正如公司与人才的关系一样,人才与某个岗位挂钩,本质上是可以把人当成工具来看的。而当对chatGTP的投产比高于人的时候,那么从公司的角度一定会选择chatGTP而不是选择人。


未来大家都能用上chatGTP了,那么在这样高效率的工具面前,利用这个高效工具拿到结果的能力,就不仅仅只是专业能力。站在全局的角度去搜索和整合信息的能力,会显得更为重要。


聪明的人能够把chatGPT发挥10倍的作用,普通人只能发挥1倍的作用,从而产生了差距。


介于AI的爆发早晚都会到来,那么我就通过AI查阅一下如果他来了,我们可以看到现有的商业模式有哪些,并且哪些模式能跟AI结合到一起呢?


所以,今天这一篇文章主要是通过chatGTP对目前常见的一些商业模式的收集,希望对大家有帮助。


01传统商业模式


传统的商业模式是:企业通过生产和销售产品或服务来获得利润。


比如卖衣服、买鞋子、卖蜂蜜等等实物的方式。这种模式的核心是降低成本和提高销售量。


目前我们这种模式做的比较成功的公司有:Coca-Cola、walmart、Procter & Gamble、McDonalds和Ford。


Coca-Cola是全球性的饮料生产企业。


walmart是全球最大的零售企业。


Procter & Gamble是全球性的消费品制造商。


McDonalds是全球性的快餐企业。


Ford是全球性的汽车制造商。


02订阅模式


订阅模式是:企业提供订阅服务来为企业带来稳定的现金流和客户关系。


这种模式的优势在于可以提供更好的客户体验和更稳定的收益。


目前我们这种模式做的比较成功的公司有:Netflix、Amazon Prime、Spotify、The New York Times和Dollar Shave Club。


Netflix是全球性的在线流媒体服务提供商。


Amazon Prime是亚马逊提供的一个订阅服务,订阅用户可以享受免费快递、流媒体服务和其他福利。


Spotify是一家全球性的音乐流媒体服务提供商,可以通过订阅服务来获取音乐和广播。


The New York Times是全球知名的报纸和新闻网站,通过定于服务向用户提供新闻和其他内容。


Dollar Shave Club是一家提供订阅式刮胡刀和理发产品的企业,通过订阅服务向用户提供每月定期配送的产品。


03平台模式


平台模式的企业,提供一个平台来连接买家和卖家,从而获得利润。


比较常见的国内平台有淘宝、天猫、美团、滴滴打车等等。


这种模式的优势在于可以快速扩展规模和提高利润率。


目前做的比较成功的企业有:Airbnb、Uber、Amazon Marketplace、Upwork和eBay。


Airbnb是一家在线的短期住宿预定平台,这个平台提供者房屋出租和旅游体验预定服务。


Uber是一家提供打车服务的在线平台,通过连接司机和乘客,提供便捷的打车服务。


Amazon Marketplace是亚马逊提供的一个在线市场平台,卖家可以在上面销售自己的商品。


Upwork是一个在线自由职业者和雇主的平台,雇主可以在上面发布任务,自由职业者可以在上面寻找机会。


eBay是一家全球性的在线拍卖和购物平台,卖家可以在上面销售商品,买家可以在上面购买商品。


04开放式商业模式


开放式商业模式的企业通过:开放自己的技术、数据和知识产权,与其他公司和个人合作,从而获得更大的市场和创新机会。


目前做的比较成功的企业有:Android、IBM Linux、Tesla、Salesforce和Wikipedia。


Android是一款由Google开发的开放式移动操作系统,允许开发者在其上开发应用程序。


IBM Linux是IBM 在 2000 年将其操作系统Linux开放源代码,从而为Linux社区的发展做出了重大贡献。


Tesla是一家全球知名的汽车制造商,其开放商业模式在于其开放自己的电池技术和充电网络,与其他汽车制造商合作,从而扩大了市场和创新机会。


Salesforce是一家提供云计算解决方案的企业,其开放商业模式在于其开放自己的API接口,允许其他企业和开发者在其上开发应用程序。


Wikipedia是一个免费的在线百科全书,其开放商业模式在于其开放自己的内容和编辑权限,允许用户编辑和更新条目。


05企业社会责任模式


企业社会责任模式的企业通过履行社会责任来提高品牌形象和市场份额。


这种模式的优势在于可以赢得消费者和员工的认可和支持。


目前做的比较成功的企业有:Patagonia、Ben &Jerry's、TOMS和The Body Shop。


Patagonia是一家知名的户外用品制造商,其企业社会责任模式在于其对环境和气候变化的重视和投资,例如推广可持续农业和使用环保材料。


Ben &Jerry's是一家知名的冰淇淋制造商,其企业社会责任模式在于其对社会公正和环保的关注和投资,例如推广可持续农业和支持社会公益事业。


TOMS是一家知名的鞋类品牌,其企业社会责任模式在于其对弱势群体的关注和投资,例如每出售一双鞋,就会捐赠一双鞋给需要的人。


The Body Shop是一家知名的化妆品品牌,其企业社会责任模式在于其对环境、社会公正和动物权益的关注和投资,例如推广环保材料和支持社会公益事业。


06服务模式


服务模式的企业通过提供各种服务,例如咨询、培训、维修等,从而获得利润。


目前做的比较成功的企业有:Uber、Airbnb、Amazon Prime和Netflix。


Uber是一家科技公司,提供网络预订的出租车服务。


Airbnb是一家在线市场,提供旅游住宿服务。


Amazon Prime是亚马逊公司提供的一个订阅服务,用户每年支付一定的费用,即可享受包括免费配送、视频流媒体等在内的各种优惠和服务。


Netflix是一家在线视频流媒体服务提供商,为用户提供了大量的电影和电视节目。


07建立生态系统模式


建立生态系统模式企业通过建立一个完整的生态系统来为客户提供全方位的服务,并从中获得利润。


目前做的比较成功的企业有:苹果公司的ioS生态系统、谷歌的Android生态系统和微软的Azure云计算生态系统。


苹果公司的ioS生态系统是苹果公司通过其iOS生态系统建立了一个完整的生态系统,包iPhone、iPad、Mac电脑、Apple Watch等设备、App Store、iTunes Store、Apple Music等服务。


谷歌的Android生态系统是谷歌通过其Android生态系统建立了一个大规模的生态系统,包括数百万款应用程序、各种服务和设备,例如Pixel手机、Google Home等。


微软的Azure云计算生态系统是微软通过其Azure云计算生态系统建立了一个全球性的云计算平台,为用户提供了各种云服务,如laas、 Paas、SaaS等。


08生产线模式


生产线模式的企业通过控制生产线上的每一个环节来提高效率和降低成本。


目前做的比较成功的企业有:丰田生产线模式、摩根汽车生产线模式和富士康生产线模式。


丰田生产线模式是丰田生产线模式是一种高效的、精益的生产方式,它的核心是“精益生产”和“精益流程”。


摩根汽车生产线模式是摩根汽车是一家英国的小型汽车制造商,采用传统的手工制造方式和高度定制化的生产线模式。


这种模式的成功在于,它能够为客户提供独一无二的汽车,满足客户对于个性化和品质的需求。


摩根汽车凭借这种模式在高端汽车市场上获得了成功。


富士康生产线模式是富士康是一家全球性的电子制造服务提供商,采用高度自动化和标准化的生产线模式。


总结


以上,就是我通过chatGPT帮我整理的8大商业模式,希望大家能根据自己的资源选择能结合的商业模式。


如果这篇文档对你有帮助,欢迎点赞、关注或者在评论区留言,我会第一时间对你的认可进行回应。精彩内容在后面,防止跑丢,友友们可以先关注我,每一篇文章都能及时通知不会遗失。


作者:程序员摩根
来源:juejin.cn/post/7217360688263413817
收起阅读 »

vue3 实现 chatgpt 的打字机效果

在做 chatgpt 镜像站的时候,发现有些镜像站是没做打字机的光标效果的,就只是文字输出,是他们不想做吗?反正我想做。于是我仔细研究了一下,实现了打字机效果加光标的效果,现在分享一下我的解决方案以及效果图 共识 首先要明确一点,chatgpt 返回的文本格...
继续阅读 »

在做 chatgpt 镜像站的时候,发现有些镜像站是没做打字机的光标效果的,就只是文字输出,是他们不想做吗?反正我想做。于是我仔细研究了一下,实现了打字机效果加光标的效果,现在分享一下我的解决方案以及效果图


Kapture 2023-04-14 at 14.02.32.gif


共识


首先要明确一点,chatgpt 返回的文本格式是 markdown 的,最基本的渲染方式就是把 markdown 文本转换为 HTML 文本,然后 v-html 渲染即可。这里的转换和代码高亮以及防 XSS 攻击用到了下面三个依赖库:



  • marked 将markdwon 转为 html

  • highlight 处理代码高亮

  • dompurify 防止 XSS 攻击


同时我们是可以在 markdown 中写 html 元素的,这意味着我们可以直接把光标元素放到最后!


将 markdown 转为 html 并处理代码高亮


先贴代码


MarkdownRender.vue


<script setup>
import {computed} from 'vue';
import DOMPurify from 'dompurify';
import {marked} from 'marked';
import hljs from '//cdn.staticfile.org/highlight.js/11.7.0/es/highlight.min.js';
import mdInCode from "@/utils/mdInCode"; // 用于判断是否显示光标

const props = defineProps({
// 输入的 markdown 文本
text: {
type: String,
default: ""
},
// 是否需要显示光标?比如在消息流结束后是不需要显示光标的
showCursor: {
type: Boolean,
default: false
}
})

// 配置高亮
marked.setOptions({
highlight: function (code, lang) {
try {
if (lang) {
return hljs.highlight(code, {language: lang}).value
} else {
return hljs.highlightAuto(code).value
}
} catch (error) {
return code
}
},
gfmtrue: true,
breaks: true
})

// 计算最终要显示的 html 文本
const html = computed(() => {
// 将 markdown 转为 html
function trans(text) {
return DOMPurify.sanitize(marked.parse(text));
}

// 光标元素,可以用 css 美化成你想要的样子
const cursor = '<span class="cursor"></span>';
if (props.showCursor) {
// 判断 AI 正在回的消息是否有未闭合的代码块。
const inCode = mdInCode(props.text)
if (inCode) {
// 有未闭合的代码块,不显示光标
return trans(props.text);
} else {
// 没有未闭合的代码块,将光标元素追加到最后。
return trans(props.text + cursor);
}
} else {
// 父组件明确不显示光标
return trans(props.text);
}
})

</script>

<template>
<!-- tailwindcss:leading-7 控制行高为1.75rem -->
<div v-html="html" class="markdown leading-7">
</div>
</template>

<style lang="postcss">
/** 设置代码块样式 **/
.markdown pre {
@apply bg-[#282c34] p-4 mt-4 rounded-md text-white w-full overflow-x-auto;
}
.markdown code {
width: 100%;
}

/** 控制段落间的上下边距 **/
.markdown p {
margin: 1.25rem 0;
}
.markdown p:first-child {
margin-top: 0;
}

/** 小代码块样式,对应 markdown 的 `code` **/
.markdown :not(pre) > code {
@apply bg-[#282c34] px-1 py-[2px] text-[#e06c75] rounded-md;
}

/** 列表样式 **/
.markdown ol {
list-style-type: decimal;
padding-left: 40px;
}
.markdown ul {
list-style-type: disc;
padding-left: 40px;
}

/** 光标样式 **/
.markdown .cursor {
display: inline-block;
width: 2px;
height: 20px;
@apply bg-gray-800 dark:bg-gray-100;
animation: blink 1.2s step-end infinite;
margin-left: 2px;
vertical-align: sub;
}
@keyframes blink {
0% {
opacity: 1;
}
50% {
opacity: 0;
}
100% {
opacity: 1;
}
}
</style>

可以发现最基本的 markdown 显示还是挺简单的,话就不多说了,都在注释里。


我想你也许对判断消息中的代码块是否未闭合更感兴趣,那么就继续看下去吧!


代码块是否未闭合


markdown 有两种代码块,一种是 `code` ,另一种是 ``` code ```,我叫他小代码块和大代码块。


一开始我是想用正则去判断的,但是奈何有点复杂,我实在想不出应该如何去编写正则,让 chatgpt 写的正则也会判断失败,而且还要考虑到转义符,就算写出了正则,估计也会很复杂和难以维护。


经过短暂的苦思冥想后,我想到了之前在 《Vue.js设计与实现》 中看到的用有限元状态机解析 html 文本的方案。


这里有请 chatgpt 简单介绍一下有限元状态机:



有限元状态机(finite element state machine)是一种基于状态机的建模技术,它可以将系统的行为描述为一组状态和状态之间的转换。每个状态可以对应系统内的一种状态,而状态之间的转换则表示系统内部的转换过程。有限元状态机还可以用于系统的可靠性分析和测试,同时也可以作为软件工程中的一种建模工具,帮助代码实现、测试和调试等方面。


在实际应用中,有限元状态机通常是通过自动化工具生成,并且可以用于控制系统、网络通信协议、软件接口等方面的设计和测试。由于有限元状态机具有自动化生成和完备性检查等优点,因此它已经成为了一种广泛应用的建模与测试工具。



请站在web前端的视角下进行介绍



从前端开发的角度来看,有限元状态机可以用于构建复杂的交互式Web应用程序。在Web应用程序中,有限元状态机可以描述用户界面的不同状态(例如,登录、注册、未登录等),以及状态之间的转换(例如,从登录状态转换到注册状态)。


通常情况下,前端工程师使用JavaScript实现有限元状态机,包括定义状态、定义状态之间的转换规则、处理状态转换时的行为等。使用有限元状态机可以帮助前端工程师更好地掌控应用程序的状态,从而减少代码中的复杂条件分支和无法预测的行为。同时,有限元状态机也可以帮助前端团队共同理解应用程序的状态和转换规则,从而更好地协作开发和维护Web应用程序。


总之,有限元状态机是一种非常有用的前端开发技术,可以帮助前端工程师更好地构建和管理Web应用程序的状态和行为,提高应用程序的可靠性和用户体验。



回到正题,我可以一点一点的从头开始去解析 markdown 文本。想象这么一个简单的状态转换流程:



  • 初始状态为文本状态。

  • 遇到代码块标记,文本状态转换到代码块开始状态。

  • 再次遇到代码块标记,从代码块开始状态转换到文本状态。


不过现实要更复杂一点,我们有小代码块和大代码块。有限元状态机的妙处就在这里,当处在小代码块状态的时候,我们不需要操心大代码块和正常文本的事,他的下一个状态只能是遇到小代码块的闭合标签,进入文本状态。


理解了这些,再来看我的源码,才会发现他的精妙。


const States = {
text: 0, // 文本状态
codeStartSm: 1, // 小代码块状态
codeStartBig: 2, // 大代码块状态
}

/**
* 判断 markdown 文本中是否有未闭合的代码块
* @param text
* @returns {boolean}
*/

function isInCode(text) {
let state = States.text
let source = text
let inStart = true // 是否处于文本开始状态,即还没有消费过文本
while (source) { // 当文本被解析消费完后,就是个空字符串了,就能跳出循环
let char = source.charAt(0) // 取第 0 个字
switch (state) {
case States.text:
if (/^\n?```/.test(source)) {
// 以 ``` 或者 \n``` 开头。表示大代码块开始。
// 一般情况下,代码块前面都需要换行。但是如果是在文本的开头,就不需要换行。
if (inStart || source.startsWith('\n')) {
state = States.codeStartBig
}
source = source.replace(/^\n?```/, '')
} else if (char === '\\') {
// 遇到转义符,跳过下一个字符
source = source.slice(2)
} else if (char === '`') {
// 以 ` 开头。表示小代码块开始。
state = States.codeStartSm
source = source.slice(1)
} else {
// 其他情况,直接消费当前字符
source = source.slice(1)
}
inStart = false
break
case States.codeStartSm:
if (char === '`') {
// 遇到第二个 `,表示代码块结束
state = States.text
source = source.slice(1)
} else if (char === '\\') {
// 遇到转义符,跳过下一个字符
source = source.slice(2)
} else {
// 其他情况,直接消费当前字符
source = source.slice(1)
}
break
case States.codeStartBig:
if (/^\n```/.test(source)) {
// 遇到第二个 ```,表示代码块结束
state = States.text
source = source.replace(/^\n```/, '')
} else {
// 其他情况,直接消费当前字符
source = source.slice(1)
}
break
}
}
return state !== States.text
}

export default isInCode

到这里,就已经实现了一个 chatgpt 消息渲染了。喜欢的话点个赞吧!谢谢!


作者:七分小熊猫
来源:juejin.cn/post/7221792648541356093
收起阅读 »

AutoGPT太火了,无需人类插手自主完成任务,GitHub2.7万星

OpenAI 的 Andrej Karpathy 都大力宣传,认为 AutoGPT 是 prompt 工程的下一个前沿。 近日,AI 界貌似出现了一种新的趋势:自主人工智能。 这不是空穴来风,最近一个名为 AutoGPT 的研究开始走进大众视野。特斯拉前 AI...
继续阅读 »

OpenAI 的 Andrej Karpathy 都大力宣传,认为 AutoGPT 是 prompt 工程的下一个前沿。


近日,AI 界貌似出现了一种新的趋势:自主人工智能

这不是空穴来风,最近一个名为 AutoGPT 的研究开始走进大众视野。特斯拉前 AI 总监、刚刚回归 OpenAI 的 Andrej Karpathy 也为其大力宣传,并在推特赞扬:「AutoGPT 是 prompt 工程的下一个前沿。」



不仅如此,还有人声称 ChatGPT 已经过时了,AutoGPT 才是这个领域的新成员。



项目一经上线,短短几天狂揽 27K + 星,这也侧面验证了项目的火爆。



GitHub 地址:github.com/torantulino…

问题来了,AutoGPT 到底是什么?它是一个实验性的开源应用程序,展示了 GPT-4 语言模型的功能。该程序由 GPT-4 驱动,可以自主实现用户设定的任何目标。



具体来说,AutoGPT 相当于给基于 GPT 的模型一个内存和一个身体。有了它,你可以把一项任务交给 AI 智能体,让它自主地提出一个计划,然后执行计划。此外其还具有互联网访问、长期和短期内存管理、用于文本生成的 GPT-4 实例以及使用 GPT-3.5 进行文件存储和生成摘要等功能。AutoGPT 用处很多,可用来分析市场并提出交易策略、提供客户服务、进行营销等其他需要持续更新的任务。

正如网友所说 AutoGPT 正在互联网上掀起一场风暴,它无处不在。很快,已经有网友上手实验了,该用户让 AutoGPT 建立一个网站,不到 3 分钟 AutoGPT 就成功了。 期间 AutoGPT 使用了 React 和 Tailwind CSS,全凭自己,人类没有插手。看来程序员之后真就不再需要编码了。



之后该用户补充说,自己的目标很简单,就是用 React 创建一个网站。提出的要求是:创建一个表单,添加标题「Made with autogpt」,然后将背景更改为蓝色。AutoGPT 成功的构建了网站。该用户还表示,如果给 AutoGPT 的 prompt 更多,表现会更好。

图源:twitter.com/SullyOmarr/…

接下里我们再看一个例子。假装自己经营一家鞋公司,给 AutoGPT 下达的命令是对防水鞋进行市场调查,然后让其给出 top5 公司,并报告竞争对手的优缺点 :



首先,AutoGPT 直接去谷歌搜索,然后找防水鞋综合评估 top 5 的公司。一旦找到相关链接,AutoGPT 就会为自己提出一些问题,例如「每双鞋的优缺点是什么、每款排名前 5 的防水鞋的优缺点是什么、男士排名前 5 的防水鞋」等。

之后,AutoGPT 继续分析其他各类网站,并结合谷歌搜索,更新查询,直到对结果满意为止。期间,AutoGPT 能够判断哪些评论可能偏向于伪造,因此它必须验证评论者。



执行过程中,AutoGPT 甚至衍生出自己的子智能体来执行分析网站的任务,找出解决问题的方法,所有工作完全靠自己。

结果是,AutoGPT 给出了 top 5 防水鞋公司的一份非常详细的报告,报告包含各个公司的优缺点,此外还给出了一个简明扼要的结论。全程只用了 8 分钟,费用为 10 美分。期间也完全没有优化。



这个能够独立自主完成任务的 AutoGPT 是如何运行的呢?我们接着来看。

AutoGPT:30 分钟内构建你自己的 AI 助手

作为风靡互联网的 AI 智能体,AutoGPT 可以在 30 分钟内完成设置。 你就可以拥有自己的 AI,协助完成任务,提升工作效率。

这一强大的 AI 工具能够自主执行各种任务,设置和启动的简便性是一大特征。在开始之前,你需要设置 Git、安装 Python、下载 Docker 桌面、获得一个 OpenAI API 密钥。

克隆存储库

首先从 GitHub 中克隆 AutoGPT 存储库。



使用以下命令导航到新建文件夹 Auto-GPT。



配置环境

在 Auto-GPT 文件夹中,找到.env.template 文件并插入 OpenAI API 密钥。接着复制该文件并重命名为.env。



安装 Python 包

运行以下命令,安装需要的 Python 包。



运行 Docker

运行 Docker 桌面,不需要下载任何容器,只需保证程序处于激活状态。



运行 AutoGPT



执行以下命令,运行 AutoGPT。



设置目标**

AutoGPT 虽是一个强大的工具,但并不完美。为避免出现问题,最好从简单的目标开始,对输出进行测试,并根据自身需要调整目标,如上文中的 ResearchGPT。

不过,你如果想要释放 AutoGPT 的全部潜力,需要 GPT-4 API 访问权限。GPT-3.5 可能无法为智能体或响应提供所需的深度。

AgentGPT:浏览器中直接部署自主 AI 智能体

近日,又有开发者对 AutoGPT 展开了新的探索尝试,创建了一个
可以在浏览器中组装、配置和部署自主 AI 智能体的项目 ——AgentGPT。** 项目主要贡献者之一为亚马逊软件工程师 Asim Shrestha,已在 GitHub 上获得了 2.2k 的 Stars。



AgentGPT 允许你为自定义 AI 命名,让它执行任何想要达成的目标。自定义 AI 会思考要完成的任务、执行任务并从结果中学习,试图达成目标。如下为 demo 示例:HustleGPT,设置目标为创立一个只有 100 美元资金的初创公司。



再比如 PaperclipGPT,设置目标为制造尽可能多的回形针。



不过,用户在使用该工具时,同样需要输入自己的 OpenAI API 密钥。AgentGPT 目前处于 beta 阶段,并正致力于长期记忆、网页浏览、网站与用户之间的交互。

GPT 的想象力空间还有多大,我们继续拭目以待。

参考链接: medium.com/@tsaveratto…


作者:机器之心
链接:https://juejin.cn/post/7221089899281580091
来源:稀土掘金
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
收起阅读 »

GPT-4自我修复!国外小哥开发神级「金刚狼」,无限自我Debug

【新智元导读】继 GPT-4 超强进化后,现在还能自我修复。国外网友开发一个「金刚狼」项目,能够自动修复 Python 中的 bug,并运行代码。 要问程序员,一天中最烦的时候是什么? 那一定是给写好的程序 Debug 了。而现在,这种局面要得到改善了! 国...
继续阅读 »

【新智元导读】继 GPT-4 超强进化后,现在还能自我修复。国外网友开发一个「金刚狼」项目,能够自动修复 Python 中的 bug,并运行代码。


要问程序员,一天中最烦的时候是什么?


那一定是给写好的程序 Debug 了。而现在,这种局面要得到改善了!



国外一名叫 BioBootloader 的开发者基于 GPT-4 搞了一个叫「金刚狼」的项目,能够自我修复 Python 脚本。


从名字就能看出来,这项目主打一个「自我愈合」。通过 GPT 识别代码中的错误,并提供修改,直至程序顺利运行。


不过,「金刚狼」目前只能用在 Python 上。


这项目已经在 GitHub 上收揽了 1.2k 星,108 个 Fork。



金刚狼?金刚狼!


BioBootloader 表示,用「金刚狼」运行你的程序,只要一崩溃,GPT-4 就会自动编辑,然后给出出错的原因。


哪怕码农写了一大堆 Bug,也没事。「金刚狼」会反复运行,直到一切 Bug 都被 De 掉。



GPT-4 想必大家都不陌生。这是由 OpenAI 开发的多模态人工智能语言模型。


BioBootloader 在推特上的演示视频中,展示了「金刚狼」的具体使用方式。



视频中,开发者先写了个简单的四则运算代码,然后故意把其中一些部分写错。



(正确的)


比方说,把结尾的 return result 随便改成 return res,而 res 没有定义,于是就出错了。


小哥还把减法部分的代码删掉了,就是上方的 substract_numbers。这样一来,下面 calculate 那里就一定会报错。因为 subtract 没有定义了。



(错误的)


之后直接运行「金刚狼」即可,GPT 生成的部分会出现在右侧。



可以看到,「金刚狼」快速识别出了错误,并且附上了解释。


「脚本中没有定义 subtract_numbers.


res 这个变量没有定义,应该用 result 代替。」



不光给了建议,「金刚狼」还直接把改好的代码附上了。红色是应该删掉的部分,绿色是添加的部分。


实际上,「金刚狼」是一个封装器,它负责运行程序,捕捉错误信息,再把这些错误发送给 GPT-4,询问 GPT 代码出了什么问题。


像 GPT-4 这种 LLM(即大型语言模型),是用自然语言「编程」的,而这些指令被视为 prompts。


「金刚狼」所实现的功能很大一部分要归功于精心编写的提示,阅读这些提示就可以更好的理解整个过程。


目前该项目已经发布在了 GitHub 上。小哥也是贴心的给出了设置上的要求。



不止是 Python


在 GitHub 上,BioBootloader 发布了自己未来的计划,「金刚狼」的功能会越来越全面、强大。



「目前的版本只是我花了几个小时搞得一个原型产品。未来还会有很多可能的延展,同时欢迎大家一起来开发。」




  • 添加标志来定制使用方法,例如在运行改变的代码前要求用户确认。




  • 对 GPT 的编辑格式进行进一步的迭代。目前,GPT 在缩进方面有点困难,但我确信这一点可以得到改善。




  • 一套有问题的文件的例子,我们可以在上方的测试进行提示,以确保其可靠性,并衡量改进的如何。




  • 多个文件 / 代码库——向 GPT 发送堆栈跟踪中出现的所有文件




  • 对大文件更好地处理,即我们是否应该只向 GPT 发送相关的类 / 函数?




  • 扩展到 Python 以外的编程语言




从上面那个简单的例子可以看出来,这个脚本还是未来可期的。


毕竟,总不能让用别的语言工作的码农们看着智能 Debug Python 的「金刚狼」眼红呀。


参考资料:


twitter.com/bio_bootloa…


hackaday.com/2023/04/09/…


作者:新智元
链接:https://juejin.cn/post/7221089899280138299
来源:稀土掘金
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
收起阅读 »

推荐几个可以免费使用的ChatGPT工具

在ChatGPT相关API推出之后,各种工具如雨后春笋一般层出不穷,这篇文章就列举一些日常使用到的工具。 工具列表 myreader.io myReader主页 这款工具的作者是@madawei2699,github主页地址为t.co/adJBYWbjkF,...
继续阅读 »

在ChatGPT相关API推出之后,各种工具如雨后春笋一般层出不穷,这篇文章就列举一些日常使用到的工具。


工具列表


myreader.io


myReader主页


myReader主页


这款工具的作者是@madawei2699,github主页地址为t.co/adJBYWbjkF,…



  • 在线读取任意网页内容包括视频(YouTube),并根据这些内容回答你提出的相关问题或总结相关内容

  • 支持读取电子书与文档(支持PDF、EPUB、DOCX、Markdown、TXT),并根据这些内容回答你提出的相关问题或总结相关内容

  • 定时发送每日热榜新闻,无论新闻是中文还是其他语言,它都能使用chatGPT用中文自动总结新闻的内容,方便快速获取热点新闻信息

  • 支持 prompt 模版,能根据消息历史记录的上下文回答你的问题,甚至能和你玩游戏

  • 支持多国语音交互(英文、中文、德语与日语),它会根据你的语言使用相关语言的声音来回答你的问题,从而帮助你训练外语能力,可以理解为它是你的私人外教


具体功能演示可以参考我的AI阅读助手


chatpdf


ChatPDF主页


ChatPDF主页


这个可以看作是一个PDF辅助阅读的工具,用户上传自己的PDF之后,可以以对话的方式与工具进行交互,快速获取PDF文件的内容。


ChatPaper


专注于“科研狗”的工具,通过ChatGPT实现对论文进行总结,帮助“科研人”进行论文初筛(目前不支持针对论文内容进行对话)。


ChatPaper主页


ChatPaper主页


另外相关的工具还有润色工具、审稿工具、审稿回复工具


最后,这篇文章——ChatGPT应用开发小记中提到的基于chatGPT的应用类型的分类也有借鉴意义。


原理


之前准备写一篇专门介绍上述工具类的原理介绍(其实ChatGPT的 插件——chatgpt-retrieval-plugin),但是后来查看了几个项目的源码之后发现,这类工具的主要原理其实比较直观:



  • 解析相关输入为文本

  • 将文本分句后获取句子的embedding(这一步目前处理的处理方式大都是根据长度截断)并存储至数据库

  • 用户输入转换为embedding,并在数据库中召回相关性最高的句子集合

  • 将召回的句子与用户输入句子组装为ChaptGPT的输入,获取输出


上述思路虽然直观,但要获取更好的结果,其实除了第三步,其余每一步都有优化的空间:



  • 文本解析可以针对不同类型的数据针对性解析

  • 文本分句方式可以采取特殊标点进行分句,同时句子embedding也有很多可选生成方法

  • 召回的句子与用户输入句子组装为ChaptGPT的输入,结合任务特定的prompt,获取更适合任务的输出


具体流程图可以参考gpt-langchain-pdf:


gpt-langchain-pdf


gpt-langchain-pdf


作者:centurysee
链接:https://juejin.cn/post/7220775341727399991
来源:稀土掘金
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
收起阅读 »

AutoGPT太火了,无需人类插手自主完成任务,GitHub2.7万星

OpenAI 的 Andrej Karpathy 都大力宣传,认为 AutoGPT 是 prompt 工程的下一个前沿。 近日,AI 界貌似出现了一种新的趋势:自主人工智能。 这不是空穴来风,最近一个名为 AutoGPT 的研究开始走进大众视野。特斯拉前 AI...
继续阅读 »

OpenAI 的 Andrej Karpathy 都大力宣传,认为 AutoGPT 是 prompt 工程的下一个前沿。


近日,AI 界貌似出现了一种新的趋势:自主人工智能

这不是空穴来风,最近一个名为 AutoGPT 的研究开始走进大众视野。特斯拉前 AI 总监、刚刚回归 OpenAI 的 Andrej Karpathy 也为其大力宣传,并在推特赞扬:「AutoGPT 是 prompt 工程的下一个前沿。」



不仅如此,还有人声称 ChatGPT 已经过时了,AutoGPT 才是这个领域的新成员。



项目一经上线,短短几天狂揽 27K + 星,这也侧面验证了项目的火爆。



GitHub 地址:github.com/torantulino…

问题来了,AutoGPT 到底是什么?它是一个实验性的开源应用程序,展示了 GPT-4 语言模型的功能。该程序由 GPT-4 驱动,可以自主实现用户设定的任何目标。



具体来说,AutoGPT 相当于给基于 GPT 的模型一个内存和一个身体。有了它,你可以把一项任务交给 AI 智能体,让它自主地提出一个计划,然后执行计划。此外其还具有互联网访问、长期和短期内存管理、用于文本生成的 GPT-4 实例以及使用 GPT-3.5 进行文件存储和生成摘要等功能。AutoGPT 用处很多,可用来分析市场并提出交易策略、提供客户服务、进行营销等其他需要持续更新的任务。

正如网友所说 AutoGPT 正在互联网上掀起一场风暴,它无处不在。很快,已经有网友上手实验了,该用户让 AutoGPT 建立一个网站,不到 3 分钟 AutoGPT 就成功了。 期间 AutoGPT 使用了 React 和 Tailwind CSS,全凭自己,人类没有插手。看来程序员之后真就不再需要编码了。



之后该用户补充说,自己的目标很简单,就是用 React 创建一个网站。提出的要求是:创建一个表单,添加标题「Made with autogpt」,然后将背景更改为蓝色。AutoGPT 成功的构建了网站。该用户还表示,如果给 AutoGPT 的 prompt 更多,表现会更好。

图源:twitter.com/SullyOmarr/…

接下里我们再看一个例子。假装自己经营一家鞋公司,给 AutoGPT 下达的命令是对防水鞋进行市场调查,然后让其给出 top5 公司,并报告竞争对手的优缺点 :



首先,AutoGPT 直接去谷歌搜索,然后找防水鞋综合评估 top 5 的公司。一旦找到相关链接,AutoGPT 就会为自己提出一些问题,例如「每双鞋的优缺点是什么、每款排名前 5 的防水鞋的优缺点是什么、男士排名前 5 的防水鞋」等。

之后,AutoGPT 继续分析其他各类网站,并结合谷歌搜索,更新查询,直到对结果满意为止。期间,AutoGPT 能够判断哪些评论可能偏向于伪造,因此它必须验证评论者。



执行过程中,AutoGPT 甚至衍生出自己的子智能体来执行分析网站的任务,找出解决问题的方法,所有工作完全靠自己。

结果是,AutoGPT 给出了 top 5 防水鞋公司的一份非常详细的报告,报告包含各个公司的优缺点,此外还给出了一个简明扼要的结论。全程只用了 8 分钟,费用为 10 美分。期间也完全没有优化。



这个能够独立自主完成任务的 AutoGPT 是如何运行的呢?我们接着来看。

AutoGPT:30 分钟内构建你自己的 AI 助手

作为风靡互联网的 AI 智能体,AutoGPT 可以在 30 分钟内完成设置。 你就可以拥有自己的 AI,协助完成任务,提升工作效率。

这一强大的 AI 工具能够自主执行各种任务,设置和启动的简便性是一大特征。在开始之前,你需要设置 Git、安装 Python、下载 Docker 桌面、获得一个 OpenAI API 密钥。

克隆存储库

首先从 GitHub 中克隆 AutoGPT 存储库。



使用以下命令导航到新建文件夹 Auto-GPT。



配置环境

在 Auto-GPT 文件夹中,找到.env.template 文件并插入 OpenAI API 密钥。接着复制该文件并重命名为.env。



安装 Python 包

运行以下命令,安装需要的 Python 包。



运行 Docker

运行 Docker 桌面,不需要下载任何容器,只需保证程序处于激活状态。



运行 AutoGPT



执行以下命令,运行 AutoGPT。



设置目标**

AutoGPT 虽是一个强大的工具,但并不完美。为避免出现问题,最好从简单的目标开始,对输出进行测试,并根据自身需要调整目标,如上文中的 ResearchGPT。

不过,你如果想要释放 AutoGPT 的全部潜力,需要 GPT-4 API 访问权限。GPT-3.5 可能无法为智能体或响应提供所需的深度。

AgentGPT:浏览器中直接部署自主 AI 智能体

近日,又有开发者对 AutoGPT 展开了新的探索尝试,创建了一个
可以在浏览器中组装、配置和部署自主 AI 智能体的项目 ——AgentGPT。** 项目主要贡献者之一为亚马逊软件工程师 Asim Shrestha,已在 GitHub 上获得了 2.2k 的 Stars。



AgentGPT 允许你为自定义 AI 命名,让它执行任何想要达成的目标。自定义 AI 会思考要完成的任务、执行任务并从结果中学习,试图达成目标。如下为 demo 示例:HustleGPT,设置目标为创立一个只有 100 美元资金的初创公司。



再比如 PaperclipGPT,设置目标为制造尽可能多的回形针。



不过,用户在使用该工具时,同样需要输入自己的 OpenAI API 密钥。AgentGPT 目前处于 beta 阶段,并正致力于长期记忆、网页浏览、网站与用户之间的交互。

GPT 的想象力空间还有多大,我们继续拭目以待。

参考链接: medium.com/@tsaveratto…


作者:机器之心
来源:juejin.cn/post/7221089899281580091
收起阅读 »

上海00后小伙AI「复活」奶奶,100%还原音容笑貌,引发巨大争议

**【新智元导读】**最近,00 后小伙用 AI 技术和奶奶实现「对话」,数字生命要成为现实了吗? 你有没有特别想念的人?可能 ta 是你的亲人,也可能是你的伴侣。 无论 ta 是谁,在我们的回忆中永远有他们的一席之地,他们一辈子都会在我们心底最柔软的角落驻留...
继续阅读 »

**【新智元导读】**最近,00 后小伙用 AI 技术和奶奶实现「对话」,数字生命要成为现实了吗?


你有没有特别想念的人?可能 ta 是你的亲人,也可能是你的伴侣。


无论 ta 是谁,在我们的回忆中永远有他们的一席之地,他们一辈子都会在我们心底最柔软的角落驻留。


在哈利波特与死亡圣器中,哈利手握魔法石,他已故的爸爸、妈妈、教父和老师化作幽灵围绕在他的身边。



哈利和他们聊天,攀谈,诉说衷肠,好像他们活过来了一样,紧紧地围绕着他。


而如今,随着 AI 技术和数字虚拟人技术的不断发展,让已故的亲人变成虚拟的数字人继续和我们交谈不再是停留在科幻小说中的情节。


最近,B 站 UP 主吴伍六就用 Midjounrney、ChatGPT 和 D-ID 等最新的 AI 技术「复活」了他刚刚去世的奶奶。


网友看后纷纷表示,恐怖谷。



用 AI「复活」奶奶


在最新的一期视频中,吴伍六为我们还原了「复活」奶奶的整个过程。


首先是头像。要想生成逼真的对话,那么一个栩栩如生的 AI 头像是必不可少的。


吴伍六选择了当下主流的 AI 绘画软件 Midjourney,并上传了一张自己的照片。



最终,他选择了下面这张作为头像,并继续优化。



奶奶的头像也是一样,AI 根据上传的图片与文字描述生成了一些选择,而 UP 主再根据脑海中的回忆挑选一张最逼真的。



之后再如法炮制,用文字细化某些面部特征。比如皱纹、眼眸、发型和神态。我们可以看到,生成的头像细节非常完美。



下一步是音频。这一步的素材基本来自于过去的电话录音、录像视频或者微信语音。而 UP 主将过去奶奶的电话音频上传给了 AI。



并用音频编辑软件 AU 进行调整。调整的方向主要集中在降噪、人声增强等等。


然后将更加清晰的音频样本切割成若干秒的短句,方便进行标注。


最后将处理好的音频打包放入语音合成系统中去。



利用语音合成系统,UP 主就可以尝试输入文本转语音了。


现在,基本的素材都齐全了。接下来就是最关键的一步——生成虚拟数字人。


通过 D-ID,用户可以生成数字虚拟人,并和他们展开交流。



在左侧选择头像,右侧上传文本或音频即可。



网站上奶奶的形象栩栩如生,音频也完美还原了奶奶的「乡音」。搭配上右侧拉家常一般的聊天内容,宛如和奶奶面对面视频通话一样。



有意思的是,奶奶的这些「回复」是 UP 主借助时下大热的 ChatGPT 生成的。


他告诉 ChatGPT,「我很想我的奶奶,你能不能模仿她的口吻来和我交谈?」


透着人情味的人工智能,很难不让人感动落泪。而借助对奶奶的回忆,UP 主也竭尽全力地让 ChatGPT 更像她的奶奶。



科技的最终目标是给人提供力量。这种力量不仅是物质上的,更重要的还是精神上的。虽然这些聊天内容并不完全拟人,也会有一些不贴切的表达。


但总的来说,生活中的小细节还是能给人最温柔的体验的。



数字生命,可行吗?


吴伍六的这段视频引爆了 B 站,网友们众说纷纭。


有关于把逝去的亲人变成虚拟数字人的做法还是个新鲜事物。观念上的转变并不那么容易。


UP 主亲自评论表示,这么做的目的是为了填补自己的小遗憾。在自述中他也提到,奶奶在大年初六去世,最后的几天里奶奶意识模糊,而 UP 主也没有好好的和奶奶告别。


他表示,不会过度缅怀,希望大家能通过 AI 的发展看到未来世界的多样性。



网友「水澹澹而生烟」也表示,这段视频激起了对自己爷爷的回忆。他在 AI 应用和伦理方面并没有过多想法,也不认可把数字虚拟人当作亲人生命的延续。


但他表示,如果能再看爷爷一眼,听一听爷爷的声音,自己就会倍感慰藉。



也有网友表示了不赞同的态度。铁缸哟就认为,数字虚拟人终归还是当不了缅怀之人的精神寄托的。



不过该项技术的未来发展如何,谁也不能预料。就像流浪地球 2 里提到的数字生命的概念一样,想象和现实之间总会存在鸿沟。


没有走到那一步,或者走到那一步之前,一切都是未知的。



当然,小编比较认可网友键垩家の执事的评论。无论虚拟数字人发展到什么地步,多珍藏一些自己所爱之人的照片、音频以及影像这件事,永远不会错。


让记忆停留在心里,让回忆变得更清晰。


参考资料:http://www.bilibili.com/video/BV1QM…


作者:新智元
链接:https://juejin.cn/post/7220351836330262583
来源:稀土掘金
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
收起阅读 »

阿里正式加入ChatGPT战局,“通义千问”突然上线邀测!

阿里版ChatGPT实录 通义千问作为一个大语言模型,它的能力主要集中在文本生成上,即也能像ChatGPT一样“问啥答啥”,除此之外,它还具备一个“百宝袋”功能,功能也非常酷炫,大家普遍感兴趣的就是菜谱生成、彩虹屁生成器和免费代写情书。里面相当于一个工具箱,能...
继续阅读 »

阿里版ChatGPT实录


通义千问作为一个大语言模型,它的能力主要集中在文本生成上,即也能像ChatGPT一样“问啥答啥”,除此之外,它还具备一个“百宝袋”功能,功能也非常酷炫,大家普遍感兴趣的就是菜谱生成、彩虹屁生成器和免费代写情书。里面相当于一个工具箱,能快速生成各种指定类型的文案。


image.png


通义千问能完成哪些任务,解放哪些生产力,能达到 ChatGPT 几分功力?


从实际表现来看,通义千问与领先的GPT 4.0还有很大的差距,但是对比此前的一些AI大模型,通义千问在问答逻辑、信息检索、语句理解等方面都已经有了明显的进步,我现在对中国AI大模型的未来充满了信心。


image.png


通义千问从何而来?


通义千问的诞生并非偶然,是多年技术积累的结果。


2019年,阿里便开始了大模型的研发,当时阿里发布的语言大模型StructBERT超越谷歌、微软、Facebook,登顶了CLUE榜单。


2021年,阿里达摩院发布了国内首个超百亿参数多模态大模型M6,号称神经元达人类的10倍。


在2022年的世界人工智能大会上,阿里还发布了「通义」大模型系列,并宣布相关核心模型向全球开发者开源开放。


image.png


关于通义千问的技术细节,阿里达摩院官方没有透露详细信息。尽管官方口径低调,但懂的都懂,国内科技圈直接炸裂。实力玩家入场,大模型的竞争真正开始了。


正如ChatGPT脱胎于OpenAI的GPT系列,百度文心一言是自Ernie大模型发展而来,阿里也是国内最早开始研发大模型的技术大厂之一。


其中,M6在多次迭代之后,实现了十万亿级别的参数规模,并且M6和支付宝、淘宝的业务需求相结合,首个在国内实现了商业化落地。在去年的WAIC(世界人工智能大会)上,阿里还发布了通义大模型系列。其中核心模型均已开源开放。


image.png


人人都是低代码开发者


生成式AI产品潜力无穷,但能做出类似应用且可将其商业化的公司却凤毛麟角。不少企业认为AI能够助力企业建设,但企业内部多年积累下来的问题非常复杂,比如企业的一个人工智能平台所需要的数据需要从数十个系统获得,而这些系统的对接工作需要花费大量时间和精力,分属同一领域的不同企业的基础设施并不完全相同,简单复制粘贴是无法达到效果的。


在低代码的发展中,流行着一句话:人人都是低代码开发者。


在云计算与软件业,低代码开发,甚至无代码开发是近两年流行的热门概念。核心逻辑是利用代码库,将已有开发样例进行快速复写,整个开发过程中的人工成本趋近于0。


image.png


一套完善的底座意味着在大部分领域通用的解决方案能力。


JNPF,依托代码开发技术原理因此区别于传统开发交付周期长、二次开发难、技术门槛高的痛点。大部分的应用搭建都是通过拖拽控件实现,简单易上手,通过为开发者提供可视化的应用开发环境,降低或去除应用开发对原生代码编写的需求量,进而实现便捷构建应用程序的一种开发平台,快速助力研发人员快速搭建出一套适合企业发展的方案。


开源链接:http://www.yinmaisoft.com/?from=jueji…


image.png


大模型时代,中国力量加速竞逐


相比于现在的业界标杆ChatGPT,通义千问的进步空间还很大,阿里方面也透露,根据内测反馈,这一大模型正在飞速迭代中。


同时,阿里是全球少数在算法和算力上都有领先布局的公司之一,在算力方面也具备天然的优势。ChatGPT这把火烧到如今,国内对具备足够竞争力的国产生成式大模型的需求,正在与日俱增。


image.png


世界正在改变,一个全新的AI时代正在到来,种种不确定因素,再一次凸显了技术自研的价值。所幸这次,我们的起跑线,并没有相差那么远。


游戏不会在一夜间结束,而现在,竞逐真正开始。最后,大家有什么问题想问通义千问?请在大胆留言。


作者:jnpfsoft
链接:https://juejin.cn/post/7220331340762677303
来源:稀土掘金
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
收起阅读 »

我把我的简历丢给chatGPT,他问了我这些问题

前言 chatGPT是openAI于2022年11月推出的人工智能聊天程序,chatGTP一经推出便火爆全网,通过一问一答且结合上下文的方式自动生成问题答案,作为前端开发工程师,我们可以使用chatGTP进行代码纠错,代码优化等一系列的代码调试,当然,作为一个...
继续阅读 »

前言


chatGPT是openAI于2022年11月推出的人工智能聊天程序,chatGTP一经推出便火爆全网,通过一问一答且结合上下文的方式自动生成问题答案,作为前端开发工程师,我们可以使用chatGTP进行代码纠错,代码优化等一系列的代码调试,当然,作为一个已经失业一个月的前端开发,我们还可以让chatGTP作为面试官,来对我们进行一次模拟面试。


向chatGPT提问


提问内容需要对它进行一个身份设定,它是一名前端开发的面试官。


image.png


然后将自己的简历复制一份,最好先整理一下格式,然后抛给它。


chatGPT返回的问题


根据我的简历他问了我以下几个问题:


面试官:尊敬的面试者,您的简历显示您具备丰富的前端开发经验,我们非常高兴能邀请您来参加面试。现在让我们开始探讨一些与您工作经历和技能相关的问题,期待您的精彩回答。



  1. 请详细阐述您在使用 HTML5、CSS3 和 ES6 新特性中的心得体会,以及如何在实际项目中应用这些新特性提升工作效率与用户体验。

  2. 闭包、原型和作用域等 JavaScript 基础知识在您的项目中发挥了什么作用?请结合实际项目案例,谈谈您如何运用这些知识解决实际问题。

  3. 在您的项目经历中,如何运用 Vue 全家桶以及 MVVM 思想来提升开发效率?请结合具体项目案例谈谈您的实践经验。

  4. 您曾尝试写过一个简单的 MVVM 框架,可以简要介绍下您的实现思路和遇到的挑战吗?

  5. 您在xxx问题的经验和方法值得我们借鉴,请详细介绍这个过程以及您对于类似问题的解决方案。

  6. 您如何运用 three.js 进行 3D 可视化开发?请举例说明您在项目中的具体应用。

  7. 您在项目中遇到过哪些让您印象深刻的技术挑战?您是如何克服这些挑战的?

  8. 请谈谈您对于前端开发中代码规范和项目管理的理解,以及您在实际工作中如何保证高质量的代码输出。

  9. 在您看来,一个优秀的前端开发者应具备哪些品质和技能?请结合您的实际经历分享一下。


期待您对这些问题的精彩回答。祝您面试顺利,前程似锦!


image.png


可以看出chatGTP的模拟面试其实更偏向于对项目方面进行模拟面试,而我要求面试中包含大量八股文,这个是没有给到的,我意识到它可能是无法理解“八股文”在前端开发面试中代表的意思,于是我又换了个说法提问它。


提示chatGPT提问八股文


你是一名前端开发工程师,请根据我的简历对我进行面试,面试主要面试常见的基础知识?


image.png


chatGPT面试官对于八股文的提问


面试官:你好,根据你的简历,我了解到你具备扎实的前端开发基础。在接下来的面试环节中,我将针对一些常见的前端基础知识进行提问。请放轻松,尽量展示你的技能和经验。



  1. 请谈谈你对HTML5和CSS3新特性的理解。你在实际项目中如何运用这些新特性?

  2. 请解释一下JavaScript中的闭包(closure),并给出一个闭包的应用场景。

  3. 请简述原型链(prototype chain)的概念,以及它在JavaScript中的应用。

  4. 在你的项目中,你是如何处理跨域请求的?

  5. 请谈谈你对前端性能优化的理解,以及在项目中采取了哪些措施来提升性能?

  6. 请解释一下Event Loop(事件循环)机制以及它在JavaScript中的作用。

  7. 你在实际项目中如何使用Vue全家桶(Vue-router、Vuex等)?请分享一下你的经验。

  8. 在你的项目中,你是如何处理浏览器兼容性问题的?

  9. 请解释一下HTTP缓存机制,以及如何在项目中利用HTTP缓存提高性能?

  10. 请谈谈你对响应式设计(Responsive Design)的理解以及如何在项目中实现响应式设计。


请根据这些问题,尽量详细地展示你的知识和实际经验。如果对某个问题不太了解,也可以跳过,我们会综合评估你的技能。祝你面试顺利!


或许这些八股文还不够,可以要求它提问更多八股文


你是一名前端开发工程师,请根据我的简历对我进行面试,面试请提供更多面试常见的基础知识问题


image.png


chatGPT再次提问八股文


面试官:你好,根据你的简历,我了解到你具备扎实的前端开发基础。在接下来的面试环节中,我将针对一些更多的前端基础知识进行提问。请放轻松,尽量展示你的技能和经验。



  1. 请解释一下HTML语义化的概念及其优点。

  2. 请描述CSS盒模型(Box Model)的组成部分以及在布局中的作用。

  3. 请简要介绍一下Flex布局和Grid布局,以及它们各自的应用场景。

  4. 在JavaScript中,谈谈你对作用域和作用域链的理解。

  5. 请解释一下JavaScript的同步和异步,以及如何使用Promise、async/await处理异步操作。

  6. 请谈谈你对Vue的生命周期钩子函数的理解以及常见的应用场景。

  7. 请描述一下Vue中的计算属性(computed property)和侦听属性(watch property)以及它们的区别和应用场景。

  8. 在你的项目中,你是如何使用Webpack进行模块化打包和优化的?

  9. 请解释一下浏览器的渲染机制以及如何利用这一知识进行页面性能优化。

  10. 在项目中,你是如何进行前端安全防范,例如防止XSS攻击和CSRF攻击的?

  11. 请谈谈你对前端单元测试的理解,以及在项目中如何进行单元测试。

  12. 请解释一下前端MVC和MVVM设计模式的概念及其区别。

  13. 请谈谈你对前端性能监控和数据埋点的理解以及在项目中的应用。

  14. 请简要介绍一下如何在项目中实现前后端分离以及它带来的好处。

  15. 请谈谈你对Web Accessibility(网络无障碍)的理解以及如何在项目中实现无障碍访问。


请根据这些问题,尽量详细地展示你的知识和实际经验。如果对某个问题不太了解,也可以跳过,我们会综合评估你的技能。祝你面试顺利!


image.png


关于此次模拟面试提问的总结


这样我们此次模拟面试就获得了9条关于项目的问题,和25条关于基础的问题,细看这几个问题都是明显贴合我的简历所问的问题,大部分面试官都是会针对简历进行面试,所以根据自己的简历整理可能提到的问题是非常重要的,而关于项目方面提出的问题,与我进行大厂模拟面试所遇到的问题更为相像。通过chatGPT进行模拟面试,算得上是一场挺有质量的面试了。


尝试回答部分chatGPT模拟面试提出的问题


1. 请谈谈你对HTML5和CSS3新特性的理解。你在实际项目中如何运用这些新特性?


HTML5新出了许多语义化标签(nav,header,main等)和API(canvas,webGL),语义化标签优点在于提高代码可读性和可维护性,有利于搜索引擎更容易读懂(seo),有些特殊的屏幕阅读器可以通过分析语义化标签进行展示(比如盲人阅读器)。CSS3新出了圆角,阴影,过渡,动画,弹性布局等使创造复杂样式和交互变得更简单,也使我们可以更快的去完成页面样式。


2. 请解释一下JavaScript中的闭包(closure),并给出一个闭包的应用场景。


闭包是指函数有权访问其作用域以外的变量,这就叫闭包,闭包有两种表现形式,一种是函数作为参数传递,一种是函数作为返回值,闭包的应用场景有防抖节流函数、setTimeout、封装私有变量。闭包的缺点在于,其访问的变量不会被回收(会一直占用内存),所以会造成内存泄漏。


3. 请简述原型链(prototype chain)的概念,以及它在JavaScript中的应用。


原型链是js的一种继承方式,每个对象都有自己的__proto__属性指向其构造函数的prototype属性,当对象调用某个方法且对象里并没有定义这个方法时就会通过__proto__去寻找这个方法,如果其__proto__没有就会顺着其__proto__的__proto__就是顺着其原型链去寻找方法直到null。


4. 在你的项目中,你是如何处理跨域请求的?


因为浏览器的同源策略(ip,端口,协议需要一致),我们跨域请求的时候会出现跨域问题,
在开发环境中,我使用代理服务器(如vue.config.js中的proxy配置)解决跨域问题。在生产环境中,我是用nginx的代理解决跨域问题。
当然也可以让后端在服务器端设置响应头,允许跨域请求。或者是用websocket,websocket没有跨域问题。


5. 请谈谈你对前端性能优化的理解,以及在项目中采取了哪些措施来提升性能?


前端性能优化分为两类,一种是让文件加载更快,另一种是让文件渲染更快。


加载更快的方法



  • 让传输的数据包更小(压缩文件/图片):图片压缩和文件压缩

  • 减少网络请求的次数:雪碧图/精灵图、节流防抖

  • 减少渲染的次数:缓存(HTTP缓存、本地缓存、Vue的keep-alive缓存等)

  • 使用CDN:利用内容分发网络(Content Delivery Network)加速静态资源的加载速度,将资源部署到离用户更近的服务器


文件渲染更快的方法



  • 提前渲染:ssr服务器端渲染

  • 避免渲染阻塞:CSS放在HTML的head中 JS放在HTML的body底部

  • 避免无用渲染:懒加载

  • 减少渲染次数:对dom查询进行缓存、将dom操作合并、减少重排重绘


6. 请解释一下Event Loop(事件循环)机制以及它在JavaScript中的作用。


Event Loop是js实现异步的一种机制,它让js这个单线程语言可以实现并发操作。JavaScript引擎在执行栈为空时,会从任务队列中取出任务执行;任务队列有两类。



  • 宏任务:包括script(整个代码)、setTimeout、setInterval、setImmediate和I/O等。

  • 微任务:Promise、process.nextTick等


先执行宏任务再执行微任务


7. 你在实际项目中如何使用Vue全家桶(Vue-router、Vuex等)?请分享一下你的经验


我通过vue-router进行路由管理,通过Vuex管理全局状态,我会对路由进行懒加载,通过ES6的import,当然也可以用vue的动态组件,Vuex的核心包括state、getter、mutation和action,通过mutation去更改state的值,要注意异步操作只能放在action里。


8. 在你的项目中,你是如何处理浏览器兼容性问题的?


处理浏览器兼容性问题,我会使用autoprefixer自动添加CSS前缀,使用Babel转译新语法,使用Polyfill补充缺失功能,并针对特定浏览器进行特殊处理。


9. 请解释一下HTTP缓存机制,以及如何在项目中利用HTTP缓存提高性能?


http缓存包括强缓存和协商缓存



  • 强缓存:浏览器自己的缓存策略


强缓存是通过Cache-Control字段来控制的,值有max-age(缓存的最大时间)、no-cache(无需强制缓存)、no-store(服务端直接返回)



  • 协商缓存: 由服务器判断资源是否一样,一致则返回304,否则返回200和最新资源


判断资源是否一致,这主要通过Last-Modified/If-Modified-Since和ETag/If-None-Match头部字段实现。
Last-Modified:资源最后修改时间。
If-Modified-Since:客户端下次请求相同资源时,会发送该字段,值为上次收到的Last-Modified的值。
ETag: 资源的唯一标识
If-None-Match: 客户端下次请求相同资源时,会发送该字段,值为上次收到的ETag值。


10. 请谈谈你对响应式设计(Responsive Design)的理解以及如何在项目中实现响应式设计。


响应式设计就是指让网站在不同设备下实现自适应展示,实现响应式设计有以下几种方法



  • 不使用固定单位使用相对单位,如百分比,rem,vw/vh等

  • 尽可能的使用弹性布局

  • 媒体查询:针对不同的屏幕尺寸,修改对应的css


11. 在JavaScript中,谈谈你对作用域和作用域链的理解。


作用域是指变量和函数的可访问的上下文,就是其作用域,作用域链是由指变量或函数查找时先从当前的执行上下文往其夫级的上下文寻找,直到最外层的window。


12. 请解释一下JavaScript的同步和异步,以及如何使用Promise、async/await处理异步操作。


js是一个单线程语言,所以会同步执行代码,为了防止代码阻塞,通过时间循环机制实现了代码异步处理,当同步代码都执行完毕之后,再去执行异步代码,常见的异步代码有网络请求、alert、setTimeout等,promise是异步的解决方案,它解决了之前通过回调函数实现异步而产生的回调地狱的问题,promise有三种状态,pendding、reject、fulfilled,只能从pedding到其他状态,且过程不可逆,async和await是基于promise实现的,它是为了让异步代码看起来像同步代码,使代码更容易阅读和维护。


13. 请谈谈你对Vue的生命周期钩子函数的理解以及常见的应用场景。


vue的组件的生命周期包括组件创建、组件挂载、组件更新、组件销毁,从中产生了生命周期钩子函数。
vue2中包括 beforeCreate、created、beforeMounte、Mouted、beforeUpadte、updated、beforeDestory、destroyed,如果组件使用了keep-alive进行缓存的话,还会有active、deactive。


vue3中的生命周期包括setup,onBeforeMount、onMounted、onBeforeUpdate,onUpdatedon、onBeforeUnmount、onUnmounted。


mouted(onMounted)钩子函数可以做一些关于dom的操作,beforeDestroy(BeforeUnmount)在此阶段可以执行清理工作,如移除事件监听器、取消计时器等。


14. 请描述一下Vue中的计算属性(computed property)和侦听属性(watch property)以及它们的区别和应用场景。


计算属性是依赖其他属性变化得出结果,而侦听属性是针对数据变化而触发操作,计算属性具有缓存机制。


15. 请谈谈您对于前端开发中代码规范和项目管理的理解,以及您在实际工作中如何保证高质量的代码输出。


前端代码规范和项目管理在前端开发中非常重要,他可以保证代码风格一致,提高代码可读性,提高项目可维护性和团队协作效率。


在实际工作中我使用如下内容保证高质量的代码输出。



  • 统一的编码风格:用代码风格指南和自动化工具(如ESLint、Prettier等)

  • 使用版本控制系统: 通过git来管理代码

  • 注释和文档: 编写清晰明了的readme.md

  • Code Review: 团队成员对代码进行代码审查


总结


本次面试,各位面试官满意吗?如有什么错误欢迎大佬们评论区反馈纠正。


作者:三三两两的小久
来源:juejin.cn/post/7220274775914037285
收起阅读 »

为什么ChatGPT不是中国搞出来的?

无论是2022年11月30日上线的ChatGPT,还是最近 OpenAI 正式发布的迄今为止规模最大、功能最强悍的多模态预训练模型 GPT-4,都着实让普罗大众感受到了AI人工智能的强大威力,宣告了强人工智能时代的到来。在这场人工智能引发的破圈热闹之下,我们不...
继续阅读 »

无论是2022年11月30日上线的ChatGPT,还是最近 OpenAI 正式发布的迄今为止规模最大、功能最强悍的多模态预训练模型 GPT-4,都着实让普罗大众感受到了AI人工智能的强大威力,宣告了强人工智能时代的到来。在这场人工智能引发的破圈热闹之下,我们不免要进一步深入思考一个问题,为什么这么多年过去了,引领产业技术革命的依然是美国而不是中国?


2021年,中国以全球AI顶级会发表的论文数27.6%的比例高居榜首,而欧盟和英国以19.0%紧随其后,美国以16.9%位居第3。无论AI人工智能论文发表量还是专利申请量,中国在全世界范围内都名列前茅,那么按道理来说中国在AI人工智能领域的研究既广泛又深入,像ChatGPT这样具有里程碑意义的人工智能应用应该在中国诞生才对。虽然说自然语言理解和生成是人工智能研究领域的一座高峰,想要攀登和征服就需要持续不断地高质量资源投入,而阿里达摩院、华为以及清华大学等研究机构也在做类似的事情。不过很遗憾,最终还是美国的OpenAI率先发布了强大的ChatGPT。今天我们试图客观的分析下是什么原因造成了我们没有成为新一代技术革命的发起人,以后我们应该怎么做才能成为未来技术的引领者而不是跟随者。



原因分析


也许是因为过去中国二十年互联网的蓬勃发展,国内一些互联网巨头公司的市值可以在国际上和美国的互联网公司掰手腕了,让我们产生了不少的错觉,误以为在技术上我们也可以和美国一较高下了,但是事实真的如此吗?


相信大家在新闻中经常可以看到,这几年为了遏制中国发展,美国政府不断向中国高科技行业挥舞制裁大棒。比如向中国华为公司实施技术封锁,以国家安全为由,禁止美国公司向华为出售技术和设备。一时间中国的高端芯片行业哀鸿遍野,遭遇技术卡脖子危机。我们在感叹美国政府无耻的同时,也为自身没有预先布局底层技术研究以及体系构建而感到扼腕叹息。这次OpenAI发布的ChatGPT以及GPT4又给我们上了一课,越来越多的人认识到中国和美国的技术差距何止高端芯片,前沿的人工智能技术、强大的算力网络等等诸多高新技术方面都和美国有不小的差距。美国政府打压中国高科技行业发展这一巴掌,终于把一些还对美国抱有幻想的技术人彻底打醒,无论高端芯片还是前沿人工智能等核心技术买不来也求不来,只能靠自己一步一个脚印地走出来。当然这也坚定了我们和美国有关的技术类别必须全部实现国产化替代的决心。


过度关注商业模式,忽视底层技术研究


在过去的20年当中,中国互联网行业处在高速发展阶段,据CNNIC(中国互联网络信息中心)报告,截至2022年12月,我国网民规模达10.67亿。随着互联网在线人数的持续攀升,各种各样形态的商业模式在这片热土上不断得以验证以及发展壮大。移动支付、电商物流、外卖打车、短视频等商业形态深刻改变了老百姓的日常生活方式,为大家带来了极大的生活便利以及娱乐消遣,同时也提升了整个社会的效率。但与此同时,各大互联网公司好像都沉浸在如何发展新商业模式以及维护已有商业格局的怪圈中不可自拔,几乎所有的精力都放在业务内卷上。因此投入底层技术研究的时间和资源相对就会被挤压甚至是完全没有,最终导致被别人技术卡脖子的概率大大提升,同时能够产生颠覆性创新技术的可能性却大大降低。


对比中美两国技术发展路线,我们可以发现一个有意思的现象。在中国,技术的发展大都是围绕业务进行,也就是说当一个业务模式被推出来之后,如果想要支撑这样的业务规模就需要发展什么样的技术,那就研究和发展什么技术,通过商业模式的创新、业务的发展推动技术向前发展演进。



但是美国好像正好相反,常常是一项技术的发展进步反向催生出新的商业形态。就拿推出ChatGPT的OpenAI公司来说,它原本就是一个非营利性的技术组织,集结了AI人工智能界的各路大佬,初衷就是让人工智能向着友好的方向发展,核心宗旨在于“实现安全的通用人工智能(AGI)”,使其有益于人类。GPT模型经过不断的迭代升级最终搞出来了ChatGPT,有望成为未来人工智能应用技术的基础底座,因此未来可能将会有海量的上层应用都是基于ChatGPT来进行构建,可以毫不夸张地说,ChatGPT或者说通用大模型也许就是人工智能领域的操作系统,将来会诞生多少新的的商业模式以及业务形态不可估量,这种技术革命是自下而上的颠覆性创新将会对未来的产业形态产生深远的影响。



而我们太关注上层应用商业模式的创新了,从而忽略了底层技术的研究。我们仿佛在一次又一次的电商大促、一次又一次的短视频娱乐中逐渐迷失了方向,表面上的热闹掩盖不了底层核心技术的匮乏。其实想想就背后发凉,当下无论是互联网技术、人工智能技术等前沿技术好像都是建立在别人的技术底座之上的。那些曾经我们引以为豪的移动支付、电商物流等等不过是这些底层技术的上层应用而已。如果被人家釜底抽薪,那真的就玩不转了。所以底层技术真的非常重要,可以说没有底层技术的支撑,所有上层的应用都是空中楼阁。


缺乏长期主义


也许是国内竞争压力太大了,无论是个人还是公司,都恨不得今天投进去资金,明天就能看到结果和收益。如果在短期看不到收益的项目,一般公司实际上很难有持续的资源投入,更别提看不到明确回报周期的基础技术研究了。浮躁的氛围,层出不穷的技术噱头,表面上的热热闹闹,只会让大家都热衷于赶时髦追风口,却没有多少人能真正静下心来进行长期的技术研究。又有多少公司可以有马老师那样的魄力和实力每年10个亿连投10年,最终投出来个阿里云。


说到这里,不知道大家还记不记得区块链、VR、元宇宙这些科技名词,一开始出现的时候受到了极大的关注和资本的热烈追捧。但是当热头过去之后,现在又有多少公司还在不断地进行产品迭代,不断地进行技术深度优化研究呢?不能说完全没有但绝对是寥寥无几,与其说是他们追捧高新技术,不如说他们追捧的是如何快速赚钱的工具。至于到底是VR、元宇宙还是ChatGPT其实都无所谓,对他们来说其实就是个技术名称而已。


但是实际上无论是ChatGPT还是GPT4这样的人工智能应用,都不是横空出世的,它们都是在GPT、GPT2以及GPT3基础上逐步迭代发展而来的,这其中耗费了多少顶尖人工智能专家长期坚持的心血以及大量资金的持续投入。OpenAI在获得微软投资之前的三四年里烧掉将近1亿美元,才搞出来一个以GPT第一代模型为基础的雏形,当时还远远达不到ChatGPT今天的效果。基础技术研究不是一朝一夕就能完成的事情,它需要不断的试错,需要对未来技术发展趋势的独到眼光,更加需要长期主义的坚持。不过让我们感到欣慰的是,阿里巴巴、华为在技术研究上的投入已经每年超过1000亿,相信在不远的将来一定会有新的技术突破出现。


缺乏技术体系支撑


就好比高端芯片制造,其中涉及芯片设计、芯片制造以及封装测试都是一整套复杂的工艺缺一不可。同样通用大模型也是一个复杂的系统工程,而通用大模型的训练离不开海量的高质量训练数据、优秀的深度学习算法以及强大的算力资源支撑。ChatGPT的成功得益于高质量的标注数据,OpenAI为了获得高质量的训练数据雇佣了超过40家承包商进行数据标注,这在国内几乎是不敢想象的事情。另外以ChatGPT在2023年1月的独立访客平均数1300万计算,其对应芯片需求为3万多片英伟达A100 GPU,如果没有庞大的算力支撑,很难训练出高质量的通用大模型。


也就是说,通用大模型的训练需要一个完整的人工智能技术体系来进行支撑,否则即便有先进的算法,但如何获得高质量的训练数据,到哪里去找庞大的训练算力资源,这些都是摆在通用大模型训练面前必须要解决的问题,否则没有高质量的数据以及算力支撑也是巧妇难为无米之炊。


如何破局


通用大模型是未来人工智能的重要发展方向,我们肯定要加大资源投入力度才能有机会在未来人工智能前沿技术的竞争中占有一席之地。那我们应该怎么做才能破局呢?我想可以从以下几个方面入手。


数据方面


虽然当前中文在线联网数据也算是海量,但是数据质量普遍不高,同时数据孤岛问题比较严重。如果我们想基于中文数据来训练通用大模型,就必须对中文在线数据进行治理提高中文在线数据质量,解决数据孤岛问题,推动实现数据的共享和互联互通。


算力建设方面


结合国家东数西算工程,协调各个区域的算力中心,形成全国通用算力基础设施,加快构建国家级一体化新型算力网络体系,为通用大模型训练提供源源不断的强大算力支撑。只有这样,才能满足大模型训练所需要的算力要求,同时为强人工智能时代的到来做好算力资源储备。



意识方面


和别人的技术差距,我们当然要尽力弥补。不过我们需要注意的是我们在进步,别人也在进步,所以我们光追赶别人不行,还要有更加长远的眼光,要有对于未来准确的判断力,进行提前技术验证以及产业布局,为下一次技术革命做准备,真正成为未来技术发展的引领者而不是追随者。


总结


科技的发展进步不是一朝一夕就能实现的,它可能需要一代又一代技术人员孜孜不倦地追求。虽然我们在很多领域都已经取得了长足的进步,但是同时我们也要清醒地认识到,在计算机领域、互联网技术领域以及人工智能技术领域我们还有不小的差距需要弥补。因此少一点网红、明星的曝光,多一点科技工作者勤恳务实地宣传,努力营造技术为先、科技为先的社会氛围才是未来科技行业蓬勃发展的社会环境基础。我相信如果我们可以少一点浮躁,多一点纯粹,也许下一次的科技革命就是在中国这片土地上诞生。最后和大家分享下马老师曾经说过的一段话,我觉得对我们当下思考未来技术发展非常有帮助。



我一直觉得填补空白这句话是有问题的,不是因为欧美的就是先进的,就是我们要去填补的。其实今天我们不应该要和哪个东西接轨,适应哪国的标准,填补哪个空白,今天我们要思考的是怎么和未来接轨,怎么适应未来的标准,怎么弥补未来的空白,我们要想明白未来是如何的,以及自己到底要做成一个什么样的体系,然后再去看看别人怎么做,如果永远重复别人的语言,讨论别人设定的主题,我们不但会迷失现在,而且会错失未来。


作者:慕枫技术笔记
链接:https://juejin.cn/post/7218048201981935677
来源:稀土掘金
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
收起阅读 »

一个令人惊艳的ChatGPT项目,开源了!

最近在GitHub上发现了一个爆火的开源项目。 好家伙,凑近一看,居然还是由微软开源,并且和最近炙手可热的ChatGPT息息相关。 项目的名字叫做:Visual ChatGPT。 github.com/microsoft/v… 这个项目最早是3月上旬微软...
继续阅读 »

最近在GitHub上发现了一个爆火的开源项目。


好家伙,凑近一看,居然还是由微软开源,并且和最近炙手可热的ChatGPT息息相关


项目的名字叫做:Visual ChatGPT



github.com/microsoft/v…




这个项目最早是3月上旬微软开源的,项目宣布开源后仅用了短短一周,就斩获了2w+ star。



到现在为止,距离当初项目开源大约过去了3周多,仓库star数则来到了28k+,亦可谓是火箭式上涨(doge)。


众所周知,ChatGPT自2022年11月推出以来,持续走红。



ChatGPT具备强大的会话能力,可以理解文字、聊天、写小说、解答问题、编写代码... 但是目前还并不能直接处理或生成图像。


而Visual ChatGPT这个项目则可以把ChatGPT和一系列视觉基础模型(VFM,Visual Foundation Model)给联系起来,以便实现在ChatGPT聊天的过程中来发送和接收图像,也使得ChatGPT能够处理更为复杂的视觉任务。



讲白了,就是通过Visual ChatGPT,可以把一系列视觉基础模型给接入ChatGPT,使得ChatGPT能胜任更为复杂的视觉处理任务。



Visual ChatGPT的整体技术架构图如上所示,我们可以清楚地看到ChatGPT和视觉基础模型(VFM,Visual Foundation Model)分别位于其中的位置。


一方面,ChatGPT(或LLM)作为一个通用接口,继续发挥它本身的优势,提供对不同话题的智能理解。另一方面,基础视觉模型VFM则通过提供特定领域的深入知识来充当领域专家,它们通过交互管理模块(Prompt Manger)进行连接和适配。


这样聊可能比较抽象,我们可以拿官方给的一个例子来进行说明:



1、首先是用户:输入一张黄色的向日葵图片,并且要求ChatGPT根据该图像预测深度来生成一朵红花,然后再一步一步将其做成卡通画。


2、接着是交互管理模块(Prompt Manger)发挥作用,在它的协调和控制下,VFM模块开始发挥作用:



  • 首先需要运用深度估计模型来预测并生成图像的深度信息;

  • 然后需要运用深度图像模型来生成对应空间深度的红花图像;

  • 最后运用Stable Diffusion的风格迁移模型来完成图像风格的变换。


3、最后Visual ChatGPT系统再将最终结果返回给用户,完成本次对话。


说到这里,有兴趣的小伙伴可以可以看看微软给出的一篇有关Visual ChatGPT的论文。



里面关于这部分的流程解释得非常详细,而且还给出了多轮对话的案例、以及实验结果,有兴趣的小伙伴可以看看。


好了,今天的分享就到这里了,感谢大家的收看,我们下篇见。


作者:CodeSheep
链接:https://juejin.cn/post/7217851001087230013
来源:稀土掘金
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
收起阅读 »

阿里版ChatGPT:通义千问pk文心一言

随着 ChatGPT 热潮卷起来,百度发布了文心一言、Google 发布了 Bard,「阿里云」官方终于也宣布了,旗下的 AI 大模型“通义千问”正式开启测试! 申请地址:tongyi.aliyun.com/ 阿里云的 Ai 模型名为“通义千问”,由达摩院开...
继续阅读 »

随着 ChatGPT 热潮卷起来,百度发布了文心一言、Google 发布了 Bard,「阿里云」官方终于也宣布了,旗下的 AI 大模型“通义千问”正式开启测试!



申请地址:tongyi.aliyun.com/


阿里云的 Ai 模型名为“通义千问”,由达摩院开发,也是一款 NLP 大语言模型,主要能力也是专注在文本生成,可以做到跟 ChatGPT 类似的“你问我答”。


获得测试申请邀请码方法:



  • 注册一个阿里云帐号 (注册按钮在页面右上角)

  • 前往「通义千问」官网 tongyi.aliyun.com/

  • 填写「企业邮箱」进行报名预约,等待审核


官网宣称只邀请企业进行测试,但只要用户在报名时「使用企业邮箱」,并随便填写一个公司的名称信息即可。


 


通义千问pk文心一言


拿到测试邀请码以后,我第一时间试用了一下,并且和百度的文心一言做了对比。


为什么不直接对比ChatGPT,因为我的ChatGPT账号已经被封了哈哈。



 


 


提问:通义千问和文心一言谁更厉害?



 


 


 



 


 


 


 


提问:李明是李丽的哥哥,刘云是李丽的妈妈,李明是刘云的谁?



 


 


 



 


 


 


 


提问:通义千问没有AI绘画功能:


 



 


 



 


 


根据官网描述,通义千问是一个能专门响应人类指令的大模型,可以是一名效率助手,也可以是点子生成器。


可以非常方便地帮我们写作、写文案、翻译、解答问题等工作,支持上下文关联理解。其中官方表示比较出色的地方在于撰写文案,经测试,当说要它写一篇语文老师要求的“总分总”结构的文章它也能听得懂。


国产版ChagtGPT通义千问和文心一言,最后谁能胜出,你怎么看?


作者:邴越
链接:https://juejin.cn/post/7219925045228453946
来源:稀土掘金
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
收起阅读 »

调教ChatGPT提取公众号封面

牙叔教程 简单易懂 我抱着调教的心, 被ChatGPT调教了, 😭, 看看我是怎么被ChatGPT调教的 提取公众号prompt prompt就是提示语, ChatGPT会根据提示语做事情,  提取封面的提示语是: 用Node.js提取微信公众号封面的url...
继续阅读 »

牙叔教程 简单易懂


我抱着调教的心, 被ChatGPT调教了, 😭,


看看我是怎么被ChatGPT调教的




提取公众号prompt


prompt就是提示语, ChatGPT会根据提示语做事情, 


提取封面的提示语是: 用Node.js提取微信公众号封面的url


效果


每次登录ChatGPT太麻烦了, 还怕浏览器随时获取IP, 被openai审查, 所以自己写了个网页调用api,


想要网页的老铁, 公众号回复 api网页


用api网页可以降低封号概率, 我这个号可一次都没被封过



截图看不清楚, 我贴上文字;


只有第一行是我的, 其他的都是ChatGPT回复的内容


用Node.js提取微信公众号封面的url
要提取微信公众号封面的URL,可以使用Node.js和request模块来发送HTTP请求并解析返回的HTML页面。以下是一个示例代码:

```javascript
const request = require('request');
const cheerio = require('cheerio');

const url = 'https://mp.weixin.qq.com/s/xxxxxxxxxxxxxx'; // 公众号文章链接

request(url, function (error, response, body) {
if (!error && response.statusCode == 200) {
const $ = cheerio.load(body);
const coverUrl = $('meta[property="og:image"]').attr('content');
console.log(coverUrl);
}
});
```

在这个示例中,我们首先使用request模块发送HTTP请求,并在回调函数中处理响应。然后,我们使用cheerio模块解析返回的HTML页面,并使用jQuery样式的语法来获取页面中的元素。在这个例子中,我们使用`$('meta[property="og:image"]')`来获取页面中的`<meta>`标签,然后使用`.attr('content')`来获取`content`属性的值,即公众号封面的URL。最后,我们将URL打印到控制台中。

需要注意的是,这个示例只能提取公众号文章页面中的封面URL,而不能直接提取公众号的封面URL。如果要提取公众号的封面URL,可以参考以下代码:

```javascript
const request = require('request');
const cheerio = require('cheerio');

const url = 'https://mp.weixin.qq.com/profile?src=3&timestamp=1631955330&ver=2&signature=xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx'; // 公众号主页链接

request(url, function (error, response, body) {
if (!error && response.statusCode == 200) {
const $ = cheerio.load(body);
const coverUrl = $('.profile_header .avatar img').attr('src');
console.log(coverUrl);
}
});
```

在这个示例中,我们首先发送HTTP请求,然后使用cheerio模块解析返回的HTML页面。我们使用`.profile_header .avatar img`来获取公众号主页中的头像图片元素,然后使用`.attr('src')`来获取`src`属性的值,即公众号的封面URL。最后,我们将URL打印到控制台中。

先试试第一段代码


const request = require('request');
const cheerio = require('cheerio');

const url = 'https://mp.weixin.qq.com/s/tcorJxJBWoF0yOUHOypuQw'

request(url, function (error, response, body) {
if (!error && response.statusCode == 200) {
const $ = cheerio.load(body);
const coverUrl = $('meta[property="og:image"]').attr('content');
console.log(coverUrl);
}
});

运行以后获取到的封面图片链接


$ node 1
https://mmbiz.qpic.cn/mmbiz_jpg/n3RS3ib3lbz9krBGCZ6jkE6xROetdnyvlPEl6wmoh27gIwaKTe7EuaV7lKgsQ69uXXnVpXnXzNSKc0oG8CdSf7g/0?wx_fmt=jpeg

node 1 的意思


代码是nodejs执行的, 1是文件名1.js


链接正确吗


正确到姥姥家了, 我滴个妈呀, 我就只说了一句话, ChatGPT把事情给我办的, 妥妥当当的


提取到的封面图



还想调教ChatGPT


调教个锤子哦, 一发就中, 饭碗不保了, 兄弟们


用不了GPT怎么办?


可以用 谷歌的Bard


也可以用 微软的NewBing


微信公众号 牙叔教程


作者:牙叔教程
来源:juejin.cn/post/7219599208608284730
收起阅读 »

为什么ChatGPT不是中国搞出来的?

无论是2022年11月30日上线的ChatGPT,还是最近 OpenAI 正式发布的迄今为止规模最大、功能最强悍的多模态预训练模型 GPT-4,都着实让普罗大众感受到了AI人工智能的强大威力,宣告了强人工智能时代的到来。在这场人工智能引发的破圈热闹之下,我们不...
继续阅读 »

无论是2022年11月30日上线的ChatGPT,还是最近 OpenAI 正式发布的迄今为止规模最大、功能最强悍的多模态预训练模型 GPT-4,都着实让普罗大众感受到了AI人工智能的强大威力,宣告了强人工智能时代的到来。在这场人工智能引发的破圈热闹之下,我们不免要进一步深入思考一个问题,为什么这么多年过去了,引领产业技术革命的依然是美国而不是中国?


2021年,中国以全球AI顶级会发表的论文数27.6%的比例高居榜首,而欧盟和英国以19.0%紧随其后,美国以16.9%位居第3。无论AI人工智能论文发表量还是专利申请量,中国在全世界范围内都名列前茅,那么按道理来说中国在AI人工智能领域的研究既广泛又深入,像ChatGPT这样具有里程碑意义的人工智能应用应该在中国诞生才对。虽然说自然语言理解和生成是人工智能研究领域的一座高峰,想要攀登和征服就需要持续不断地高质量资源投入,而阿里达摩院、华为以及清华大学等研究机构也在做类似的事情。不过很遗憾,最终还是美国的OpenAI率先发布了强大的ChatGPT。今天我们试图客观的分析下是什么原因造成了我们没有成为新一代技术革命的发起人,以后我们应该怎么做才能成为未来技术的引领者而不是跟随者。



原因分析


也许是因为过去中国二十年互联网的蓬勃发展,国内一些互联网巨头公司的市值可以在国际上和美国的互联网公司掰手腕了,让我们产生了不少的错觉,误以为在技术上我们也可以和美国一较高下了,但是事实真的如此吗?


相信大家在新闻中经常可以看到,这几年为了遏制中国发展,美国政府不断向中国高科技行业挥舞制裁大棒。比如向中国华为公司实施技术封锁,以国家安全为由,禁止美国公司向华为出售技术和设备。一时间中国的高端芯片行业哀鸿遍野,遭遇技术卡脖子危机。我们在感叹美国政府无耻的同时,也为自身没有预先布局底层技术研究以及体系构建而感到扼腕叹息。这次OpenAI发布的ChatGPT以及GPT4又给我们上了一课,越来越多的人认识到中国和美国的技术差距何止高端芯片,前沿的人工智能技术、强大的算力网络等等诸多高新技术方面都和美国有不小的差距。美国政府打压中国高科技行业发展这一巴掌,终于把一些还对美国抱有幻想的技术人彻底打醒,无论高端芯片还是前沿人工智能等核心技术买不来也求不来,只能靠自己一步一个脚印地走出来。当然这也坚定了我们和美国有关的技术类别必须全部实现国产化替代的决心。


过度关注商业模式,忽视底层技术研究


在过去的20年当中,中国互联网行业处在高速发展阶段,据CNNIC(中国互联网络信息中心)报告,截至2022年12月,我国网民规模达10.67亿。随着互联网在线人数的持续攀升,各种各样形态的商业模式在这片热土上不断得以验证以及发展壮大。移动支付、电商物流、外卖打车、短视频等商业形态深刻改变了老百姓的日常生活方式,为大家带来了极大的生活便利以及娱乐消遣,同时也提升了整个社会的效率。但与此同时,各大互联网公司好像都沉浸在如何发展新商业模式以及维护已有商业格局的怪圈中不可自拔,几乎所有的精力都放在业务内卷上。因此投入底层技术研究的时间和资源相对就会被挤压甚至是完全没有,最终导致被别人技术卡脖子的概率大大提升,同时能够产生颠覆性创新技术的可能性却大大降低。


对比中美两国技术发展路线,我们可以发现一个有意思的现象。在中国,技术的发展大都是围绕业务进行,也就是说当一个业务模式被推出来之后,如果想要支撑这样的业务规模就需要发展什么样的技术,那就研究和发展什么技术,通过商业模式的创新、业务的发展推动技术向前发展演进。



但是美国好像正好相反,常常是一项技术的发展进步反向催生出新的商业形态。就拿推出ChatGPT的OpenAI公司来说,它原本就是一个非营利性的技术组织,集结了AI人工智能界的各路大佬,初衷就是让人工智能向着友好的方向发展,核心宗旨在于“实现安全的通用人工智能(AGI)”,使其有益于人类。GPT模型经过不断的迭代升级最终搞出来了ChatGPT,有望成为未来人工智能应用技术的基础底座,因此未来可能将会有海量的上层应用都是基于ChatGPT来进行构建,可以毫不夸张地说,ChatGPT或者说通用大模型也许就是人工智能领域的操作系统,将来会诞生多少新的的商业模式以及业务形态不可估量,这种技术革命是自下而上的颠覆性创新将会对未来的产业形态产生深远的影响。



而我们太关注上层应用商业模式的创新了,从而忽略了底层技术的研究。我们仿佛在一次又一次的电商大促、一次又一次的短视频娱乐中逐渐迷失了方向,表面上的热闹掩盖不了底层核心技术的匮乏。其实想想就背后发凉,当下无论是互联网技术、人工智能技术等前沿技术好像都是建立在别人的技术底座之上的。那些曾经我们引以为豪的移动支付、电商物流等等不过是这些底层技术的上层应用而已。如果被人家釜底抽薪,那真的就玩不转了。所以底层技术真的非常重要,可以说没有底层技术的支撑,所有上层的应用都是空中楼阁。


缺乏长期主义


也许是国内竞争压力太大了,无论是个人还是公司,都恨不得今天投进去资金,明天就能看到结果和收益。如果在短期看不到收益的项目,一般公司实际上很难有持续的资源投入,更别提看不到明确回报周期的基础技术研究了。浮躁的氛围,层出不穷的技术噱头,表面上的热热闹闹,只会让大家都热衷于赶时髦追风口,却没有多少人能真正静下心来进行长期的技术研究。又有多少公司可以有马老师那样的魄力和实力每年10个亿连投10年,最终投出来个阿里云。


说到这里,不知道大家还记不记得区块链、VR、元宇宙这些科技名词,一开始出现的时候受到了极大的关注和资本的热烈追捧。但是当热头过去之后,现在又有多少公司还在不断地进行产品迭代,不断地进行技术深度优化研究呢?不能说完全没有但绝对是寥寥无几,与其说是他们追捧高新技术,不如说他们追捧的是如何快速赚钱的工具。至于到底是VR、元宇宙还是ChatGPT其实都无所谓,对他们来说其实就是个技术名称而已。


但是实际上无论是ChatGPT还是GPT4这样的人工智能应用,都不是横空出世的,它们都是在GPT、GPT2以及GPT3基础上逐步迭代发展而来的,这其中耗费了多少顶尖人工智能专家长期坚持的心血以及大量资金的持续投入。OpenAI在获得微软投资之前的三四年里烧掉将近1亿美元,才搞出来一个以GPT第一代模型为基础的雏形,当时还远远达不到ChatGPT今天的效果。基础技术研究不是一朝一夕就能完成的事情,它需要不断的试错,需要对未来技术发展趋势的独到眼光,更加需要长期主义的坚持。不过让我们感到欣慰的是,阿里巴巴、华为在技术研究上的投入已经每年超过1000亿,相信在不远的将来一定会有新的技术突破出现。


缺乏技术体系支撑


就好比高端芯片制造,其中涉及芯片设计、芯片制造以及封装测试都是一整套复杂的工艺缺一不可。同样通用大模型也是一个复杂的系统工程,而通用大模型的训练离不开海量的高质量训练数据、优秀的深度学习算法以及强大的算力资源支撑。ChatGPT的成功得益于高质量的标注数据,OpenAI为了获得高质量的训练数据雇佣了超过40家承包商进行数据标注,这在国内几乎是不敢想象的事情。另外以ChatGPT在2023年1月的独立访客平均数1300万计算,其对应芯片需求为3万多片英伟达A100 GPU,如果没有庞大的算力支撑,很难训练出高质量的通用大模型。


也就是说,通用大模型的训练需要一个完整的人工智能技术体系来进行支撑,否则即便有先进的算法,但如何获得高质量的训练数据,到哪里去找庞大的训练算力资源,这些都是摆在通用大模型训练面前必须要解决的问题,否则没有高质量的数据以及算力支撑也是巧妇难为无米之炊。


如何破局


通用大模型是未来人工智能的重要发展方向,我们肯定要加大资源投入力度才能有机会在未来人工智能前沿技术的竞争中占有一席之地。那我们应该怎么做才能破局呢?我想可以从以下几个方面入手。


数据方面


虽然当前中文在线联网数据也算是海量,但是数据质量普遍不高,同时数据孤岛问题比较严重。如果我们想基于中文数据来训练通用大模型,就必须对中文在线数据进行治理提高中文在线数据质量,解决数据孤岛问题,推动实现数据的共享和互联互通。


算力建设方面


结合国家东数西算工程,协调各个区域的算力中心,形成全国通用算力基础设施,加快构建国家级一体化新型算力网络体系,为通用大模型训练提供源源不断的强大算力支撑。只有这样,才能满足大模型训练所需要的算力要求,同时为强人工智能时代的到来做好算力资源储备。



意识方面


和别人的技术差距,我们当然要尽力弥补。不过我们需要注意的是我们在进步,别人也在进步,所以我们光追赶别人不行,还要有更加长远的眼光,要有对于未来准确的判断力,进行提前技术验证以及产业布局,为下一次技术革命做准备,真正成为未来技术发展的引领者而不是追随者。


总结


科技的发展进步不是一朝一夕就能实现的,它可能需要一代又一代技术人员孜孜不倦地追求。虽然我们在很多领域都已经取得了长足的进步,但是同时我们也要清醒地认识到,在计算机领域、互联网技术领域以及人工智能技术领域我们还有不小的差距需要弥补。因此少一点网红、明星的曝光,多一点科技工作者勤恳务实地宣传,努力营造技术为先、科技为先的社会氛围才是未来科技行业蓬勃发展的社会环境基础。我相信如果我们可以少一点浮躁,多一点纯粹,也许下一次的科技革命就是在中国这片土地上诞生。最后和大家分享下马老师曾经说过的一段话,我觉得对我们当下思考未来技术发展非常有帮助。



我一直觉得填补空白这句话是有问题的,不是因为欧美的就是先进的,就是我们要去填补的。其实今天我们不应该要和哪个东西接轨,适应哪国的标准,填补哪个空白,今天我们要思考的是怎么和未来接轨,怎么适应未来的标准,怎么弥补未来的空白,我们要想明白未来是如何的,以及自己到底要做成一个什么样的体系,然后再去看看别人怎么做,如果永远重复别人的语言,讨论别人设定的主题,我们不但会迷失现在,而且会错失未来。




作者:慕枫技术笔记
来源:juejin.cn/post/7218048201981935677
收起阅读 »

意大利成首个封禁ChatGPT的国家!OpenAI CEO:我觉得没违规

【新智元导读】周五,意大利全国上下对 ChatGPT 下了封杀令。在 20 天内,OpenAI 拿不出补救措施的话,将会面临最高 2000 万欧元罚款。 就在昨天,意大利政府突然下令,封禁 ChatGPT! 很快,OpenAI 首席执行官 Sam Altman...
继续阅读 »

【新智元导读】周五,意大利全国上下对 ChatGPT 下了封杀令。在 20 天内,OpenAI 拿不出补救措施的话,将会面临最高 2000 万欧元罚款。


就在昨天,意大利政府突然下令,封禁 ChatGPT!


很快,OpenAI 首席执行官 Sam Altman 做出回应称,公司已经关停了当地的 ChatGPT 服务(但自认为并没有违反任何规定)。



自此,意大利成为了世界上第一个宣布禁用 ChatGPT 的国家。


(其他国家和地区无法使用 ChatGPT,是因为 OpenAI 一开始就没给开通。)


意大利封禁 ChatGPT,全面调查隐私问题


3 月 31 日,意大利国家隐私监管机构正式下令封禁 ChatGPT,并指控 OpenAI「非法收集个人数据」。


值得注意的是,该「临时禁令」将一直生效,直到 OpenAI 能够尊重欧盟具有里程碑意义的隐私法——通用数据保护条例(GDPR)。



文件地址:http://www.garanteprivacy.it/home/docweb…


根据意大利国家数据保护机构 GPDP 发布新闻稿,OpenAI 收集用户数据并用于算法「训练」的行为,缺乏法律依据。


同时,3 月 20 日涉及用户对话和支付信息的泄露事件,也明确地暴露出了 OpenAI 在个人信息的处理上存在着问题。


除此之外,OpenAI 虽然声称 ChatGPT 面向的是 13 岁以上的用户,但由于缺乏相应的年龄验证机制,因此未成年人很可能会看到超出其自身发展和自我认知水平的信息。


监管机构表示,OpenAI 有 20 天的时间,如不给出可行的补救措施,则会面临最高 2000 万欧元,或全球总年营业额 4% 的罚款。


对此,OpenAI 表示,现在已经为意大利用户关闭了服务,并承诺会保护用户的隐私:


「我们在训练 ChatGPT 这样的系统时,一直在努力减少个人数据,因为我们想要这个 AI 了解世界,而不是了解个人。当然我们也相信,AI 监管是必要的。」


这么看来,ChatGPT 未来在意大利的命运,可能就取决于这 20 天了。



不过,对于意大利来说,这已经不是第一次对 AI 聊天机器人采取此类行动了。


在 2 月份,监管机构就禁止了聊天机器人应用程序 Replika.ai。Replika 曾因一些用户与机器人建立的亲密关系而「臭名昭著」,后来 Replika 取消了色情角色扮演的选项,有用户甚至需要自杀热线的援助。


是否应该限制 AI 工具?


ChatGPT 发布后,虽然写论文、写代码的能力让人眼花缭乱,但它对错误信息的传播、对就业的影响,以及对整个人类社会更广泛的风险,都让很多人忧心忡忡,发出预警。


最近,封禁 GPT 技术的浪潮,更是一波接一波。


不仅图灵奖得主 Yoshua Bengio、马斯克、马库斯等千名大佬联名签署公开信,呼吁全球所有 AI 实验室暂停训练比 GPT-4 更强大的 AI 模型。


而且消费者权益保护组织 BEUC,也在近日呼吁欧盟和国家当局调查 ChatGPT。



此外,很多专家也表示,由于 AI 对国家安全、就业和教育的潜在影响,需要制定新的法规来管理 AI。


欧盟委员会发言人称:「我们希望所有在欧盟活跃的公司都尊重欧盟的数据保护规则。执行通用数据保护条例是欧盟数据保护当局的责任。」


欧盟委员会执行副主席 Margrethe Vestager 在推特上表示,正在讨论欧盟人工智能法案的委员会可能不倾向于禁止人工智能。


「无论我们使用哪种技术,都必须保护自身的权利。这就是为什么我们不规范 AI 技术,而是规范 AI 的使用。」



在美国,非营利组织人工智能与数字政策中心(CAIDP)也要求联邦贸易委员会(FTC)调查 OpenAI 是否违反了消费者保护规则,并禁止其进一步发布 GPT-4。


毕竟,有了千名大佬的联名信这个先例,CAIDP 的申诉看起来也似乎更加顺理成章。而且,CAIDP 主席 Marc Rotenberg 好不意外地也签署了那封信。



文件地址:cdn.arstechnica.net/wp-content/…


整体来说,CAIDP 申诉的内容与那封信一致,都是呼吁放慢生成式 AI 模型的发展,并实施更严格的政府监督。


不过,CAIDP 更进一步地认为,ChatGPT「存在偏见、具有欺骗性,并且对公共安全构成风险」。


虽然 OpenAI 已经公开指出 AI 生成文本的潜在威胁,但 CAIDP 认为,GPT-4 已经远远越线了,为了保护消费者,应该采取监管行动。


CAIDP 表示,GPT-4 模型具有许多重大的潜在威胁,比如 GPT-4 可以产生恶意代码,和高度定制宣传的方式,而它有偏见的训练数据,可能导致在招聘等方面形成刻板印象,或不公平的种族和性别偏好。


CAIDP 认为,OpenAI 的行为违反了 FTC 法案第 5 条,这一条令禁止不公平和欺骗性的贸易行为。


其中,AI 模型的幻觉,信口开河胡说八道的问题,在 CAIDP 看来都是欺骗。它警告 ChatGPT「宣传具有欺骗性的商业声明和广告」,这些都可能纳入 FTC 的权限范围。



在申诉中,CAIDP 要求 FTC 停止 GPT 模型所有进一步的商业部署,并要求在未来推出任何模型之前,都要对模型进行独立评估。它还要求提供一种可公开访问的举报工具,类似于允许消费者提出欺诈投诉的那种。


CAIDP 主席 Lina Khan 表示,CAIDP 在寻找大型科技公司试图垄断竞争的迹象,而对 AI 军备竞赛的主要参与者之一 OpenAI 的调查,标志着调查的重大升级。


有分析认为,虽然 CAIDP 的申诉在短时间内不会让 FTC 有所行动,但未来很有可能会出现相关的监管,并可能让 GPT-5 的发布推迟。


最后,只能说,谷歌一直担心的「声誉风险」,终于来了。


参考资料:


http://www.reuters.com/technology/…


作者:新智元
链接:https://juejin.cn/post/7217644586868834364
来源:稀土掘金
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
收起阅读 »

GPT-4杀疯了! Copilot X 重磅来袭 动动嘴就能写代码

本文正在参加 人工智能创作者扶持计划 大家好,我是小鱼。前段时间微软给office全家桶都加上了GPT-4的功能,并且带来了焕然一新的产品 Microsoft 365 Copilot。3月23日Github官方发布推特宣布,一款基于AI驱动的跨时代的代码编辑器...
继续阅读 »

本文正在参加 人工智能创作者扶持计划


大家好,我是小鱼。前段时间微软给office全家桶都加上了GPT-4的功能,并且带来了焕然一新的产品 Microsoft 365 Copilot。3月23日Github官方发布推特宣布,一款基于AI驱动的跨时代的代码编辑器 Github Copilot X 横空出世,将为开发者们带来前所未有的变成体验。


image.png


不知道大家有没有用过上一代的 copilot,其实已经很强大了,很多时候双击tab一行代码就出来了,仿佛能读心。
Copilot X是一种更新版本,增加了聊天模式等新功能。它也是一款人工智能代码助手,可以在编写代码时提供建议和代码段,从而帮助开发人员节省时间和精力。


Copilot X最显著的改进是增加了聊天模式,和Copilot X的交互变得更加自然和直观。在聊天模式下,开发人员可以使用自然语言向Copilot X提出问题,例如“如何将数组排序?” Copilot X会根据开发人员的问题,提供相应的建议和代码段,帮助开发人员解决问题。这种交互方式不仅提高了效率,而且还使得使用Copilot X变得更加容易上手。


除了聊天模式之外,Copilot X还增加了其他新功能。例如,它可以识别代码中的错误并提供修复建议,还可以自动完成代码段。此外,Copilot X还提供了更广泛的编程语言支持,包括JavaPythonJavaScript等。接下来我们就展开这些功能来讲讲Copilot X带给我们的惊喜


image.png




1. Github Copilot Chat 边写代码边跟AI对话


这次Github Copilot X在产品中内置了一个聊天的窗口,把GPT-4加入到了实际的开发场景中,并且集成到了VSCode和Visual Studio上。这个聊天窗口除了可以进行实时的交互问答之外,它还可以完成像代码内容识别报错信息显示语音交流等操作。通过这个功能开发人员可以更深入的分析和了解各个代码的用途,快速的生成单元测试,甚至还能一键修改Bug......


image.png


2. Copilot for Pull Requests 让AI来协助处理PR


如果你维护过开源的项目或者平时用Git进行过团队的协作时,那么你应该知道规范化的提交 Pull Requests(PR)对整个团队来说的重要性,一个清晰简洁的PR描述信息能够让代码的审查者一目了然,快速的了解你的代码变动的情况,减少项目合并出错的风险,并且提高沟通的效率。


这次 Copilot X 引入了 GPT-4 的模型,可以通过动态提取与分析代码的变更信息来自动的生成描述,程序员只需要在PR的描述中插入标记,Copilot就能够自动识别并且进行扩展补写。支持的标记主要有以下几种



  1. copilot:summary 生成一段摘要的总结

  2. copilot:walkthrough 生成详细的代码更改列表以及相关的代码片段链接

  3. copilot:poem 写一首诗来描述本次的改动

  4. copilot:all 自动生成以上所有内容


99965.gif


后续产品还会新增 GentestGhost text 两大功能



  1. Gentest 可以通过AI来识别PR中可能缺少的测试,并且自动的帮你构建和生成测试

  2. Ghost text 可以在你编写PR描述或者文档的时候提供内容的自动补全功能。不仅如此,当你收到用户提交的issue时,如果没有比较好的方案,AI还会给你提供建议。估计再过不久,AI就要帮你自动的调整代码、完善PR了......要抢我饭碗??


image.png


3. Copilot for docs 基于AI的智能文档系统


文档对开发者来说其重要性不言而喻,无论你是新接手一个项目还是忘记了某个API的具体使用办法,这个时候你都希望有一个完整的文档在你面前。所以,为了帮助你更快的定位文档的内容,简洁直接的获取到你想要的信息,Copilot for docs 就出现了。


用户能够通过类似于ChatGPT的界面,针对于项目的文档,常用代码发起提问,Copilot 就会自动定位到并且返回文档中的相关内容,大家也可以把 Copilot 当做一个知识库来用。


7894.gif


4. Copilot for CLI 使命令行用起来更加的智能


命令行终端command line也是开发者日常工作必不可少的工具之一,大家都喜欢在ITerm上安装各种各样的命令行的生产力工具,这些工具在大多的时候,能够帮我们处理一些问题,但是有些比较少用到的工具经常也会忘掉它们的命令,那这个时候我们就会输入help来获取到关于该命令的更多信息。


对于一些功能比较复杂的命令行工具来说,可能会时不时的去查一下或者stackoverflow一下。但是以后就不需要啦,Copilot for CLI 提供了三个新的shell命令,分别是 ??git?gh?




  1. ?? 可以作为任何shell命令的通用的 go to,你只需要在这个命令的后面输入相关的描述 Copilot 就会列出跟描述最匹配的命令。例如列出所有的js文件列表只需要输入 ?? list js files
    image.png




  2. git?专门用来搜索和调用Git的,相比??,它在生成Git命令方面要强大得多。如果你明确要使用的是Git命令,那就可以优先选择用这个




  3. gh?结合了 Github CLI 命令的灵活性以及查询界面的便捷性,让搜索可以变得更加快捷,信息展示得更加清晰




5. Copilot Voice 通过语音来生成代码


记得 Github Copilot 刚出来的时候,网上就有人讨论,AI这么牛逼,以后是不是就可以只动动嘴皮子就能帮我写代码了,这一天,就真的来了。


Copilot Voice 用户通过与 Github Copilot 的交谈,它就能够立即编写代码,直接解放你的双手,不满意还可以接着说话(接着奏乐接着舞...)


image.png


通过对话 Copilot Voice 可以完成以下这些工作



  1. 代码跳转 比如说跳转到代码的某一行,某个方法等等

  2. 控制IDE 开启zen模式运行程序或者运行其他的VSCode指令

  3. 代码总结 例如问它第三行到第十行这个代码表示什么意思....


3336.gif


所有这些工作张张嘴你就能搞定,这次发布的 Github Copilot X 围绕着AI对话、pull request的提交处理、文档智能检索与阅读、命令行改造以及最后的语音生成代码,几乎可以说是全方位的颠覆了传统的编程方式。


最后看了网上很多评论,网友纷纷表示,编程已经被ChatGPT永远地改变了。


「作为一个开发者,这实在是令人沮丧。编程中,我们快乐的源泉是与逻辑打交道和解决技术问题,而不是专注于生产力或满足需求。」


「我已经做了30年的编程,但我仍然很喜欢它。我不知道没有人类代码的世界会是什么样子。不过我确实很喜欢有CoPilot来处理那些烦人的东西,还有ChatGPT来帮助我解决bug。」


「AI出现后,可能就不再需要这么多码农了。对此我感到非常焦虑,即便已经在各种存钱和投资了,但还需要差不多9年时间才能『躺平』。我略微羡慕那些在FANG工作的人,他们似乎可以轻而易举地实现财务自由。」


「从中长期来看,我们将会失去工作。」


「程序员们终于用编程把自己淘汰了……」




还是希望大家有自己的思考,理性看待,找到属于自己的方向。码农没“死”,只是换了一种方式重新开始......


image.png


作者:一条小尾鱼
链接:https://juejin.cn/post/7215397054260150309
来源:稀土掘金
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
收起阅读 »

破解文心一言的水印

昨天文心一言排队终于到我了,顺便玩了玩和 GPT 还是有很大差距的,如果 GPT 是一个成人,一言顶多初中生,甚至这估计的水平都有一点虚高,如果把 GPT 阉割了我都能接受,这一言时常智障。 技术不怎么滴,防盗倒是防的狠: 直接禁用开发者的调式功能 烂产品标...
继续阅读 »

昨天文心一言排队终于到我了,顺便玩了玩和 GPT 还是有很大差距的,如果 GPT 是一个成人,一言顶多初中生,甚至这估计的水平都有一点虚高,如果把 GPT 阉割了我都能接受,这一言时常智障。


技术不怎么滴,防盗倒是防的狠:



  1. 直接禁用开发者的调式功能

  2. 烂产品标配,水印功能


debug


这个模式估计全世界中文网站用的最多了,一打开开发者工具,就断点调试:


不能使用


破解也很简单,打开控制台之后点击红圈处,禁掉断点调试,然后刷新页面 devtools 就能使用了。


image.png


水印


中文互联网牛皮癣之一,尤其是破百度真以为自己家的产品做的多好,哪个是原创的?


image.png


直接删除 DOM,不可以,前端监听了 DOM 属性是否有变化,一旦有改变重新渲染。破解也很简单,禁用掉浏览器的 JavaScript。


image.png


此时删除水印 DOM 世界就清净了,截图分享的快乐又回来了。


一个友好的提示


这里有一个无用的知识,就是禁用 JavaScript 的时候可以在 CSS 中监听到:


no-scripting-small.gif


这种友好的功能肯定不是像百度一样用在这地方,而是用在 JavaScript 加载失败或者 1% 的用户禁用 JavaScript 友好的提示。


详情看这里:how-to-detect-disabled-javascript-in-css


作者:蜡笔小伟
来源:juejin.cn/post/7216992973417840701
收起阅读 »

Bard还考不上哈佛?谷歌CEO劈柴预告它即将开挂,数学逻辑能力飙升

编辑:编辑部 【新智元导读】数学考试不及格,让 Bard 考上哈佛,可以说是难上加难。谷歌 CEO 劈柴称,未来几天大家会看到升级版的 Bard,数学逻辑能力大大提升,甚至未来还会编码。 捂了快两个月,谷歌用来跟 ChatGPT 对打的聊天机器人 Bard,前...
继续阅读 »

编辑:编辑部


【新智元导读】数学考试不及格,让 Bard 考上哈佛,可以说是难上加难。谷歌 CEO 劈柴称,未来几天大家会看到升级版的 Bard,数学逻辑能力大大提升,甚至未来还会编码。


捂了快两个月,谷歌用来跟 ChatGPT 对打的聊天机器人 Bard,前一阵终于被推上了台面。


用户们的测试初体验就是——莫得感情,错误很多,代码基本写不了


几天前,谷歌前员工 Jacob Devlin 甚至还曝出惊人内幕,Bard 疑似是通过 ChatGPT 的数据进行训练的。不过谷歌发言人已经明确否认这一说法。


而近日,谷歌 CEO 劈柴在接受纽约时报采访中证实,Bard 聊天机器人将很快得到改进,未来会由「更强大的模型」提供支持。


升级版 Bard 即将上线


劈柴称,



未来几天,Bard 将很快从目前基于 LaMDA 的模型转向更大规模的 PaLM 数据集。

我们显然拥有能力更强的模型,很快,也许随着这项技术的上线,我们将把 Bard 升级到更强大的 PaLM 模。这将带来更多的功能,无论是在推理还是编码方面。




近日,升级版 Bard 的能力也渐渐浮出水面。


领导 Bard 的一位谷歌高管 Jack Krawczyk 在推特上也介绍了最新的进展。


背靠 PaLM 的 Bard,现在在数学和逻辑方面的能力有了很大的提升。


这意味着什么呢?现在,Bard 将更好地理解并回应用户的多步推理和数学问题提示,编码功能也即将推出。



Krawczyk 称,「我们一直在平衡 Bard 的新功能与效率。这次更新是我们每周对 Bard 进行的众多改进中的一个例子。未来还有更多的内容要推出。」


众所周知,Bard 背后基于的大模型便是 LaMDA。


在去年,谷歌曾分享了关于这个大型语言模型的细节,使用了 1370 亿参数训练了 LaMDA。而 PaLM 模型有 5400 亿参数。



这两种模型都是从 2022 年初开始发展和成长起来的。


这种对比可能显示了,为什么谷歌现在正在慢慢地将 Bard 转移到,能够提供更大数据集和更多不同答案的 PalM。


其实除了 Bard,谷歌最近几周内部还在酝酿着一个新的项目——Gemini(双子座),目标是要能与 GPT-4 一战。


目前,Gemini(双子座)是由谷歌大脑和 DeepMind 两个团队联手研发。



就连谷歌大脑的负责人 Jef Dean 都亲临上阵,自动敲代码,可见,这个项目对谷歌的重要性不言而喻。


此外,采访中,皮查伊就千名大佬暂停比 GPT-4 更强 AI 系统研发的联名信发表了自己的看法:


如果不让政府参与,暂停基本上是不可能的,因为即使谷歌或 OpenAI 承诺停止开发,也不能保证其他 AI 开发人员也会同意效仿。


而且,他也同意法规是必要的,并称这封信是「对话的开始」。


谷歌先打预防针:它还不行


如今,既然 Bard 已经开放公测,拉踩的环节必然是少不了。


我们都知道,OpenAI 家的 GPT-4,都已经能考上斯坦福了。


很不幸,相比之下,谷歌的 Bard 真的拉跨,目前的它想考上斯坦福和哈佛,可以说还是天方夜谭。


Bard 的不完美,CEO 劈柴一开始就给我们打了预防针。


他在备忘录中写道:「Bard 还处于早期阶段,总会出错。随着越来越多的人开始使用 Bard,它会让我们惊讶的。」



而网友们测试 Bard 之后,表示对它很失望。


很不幸,Bard 目前还考不进哈佛大学,因为它回答的大部分数学题都是错的,而且它在写作和语言测试中也表现得不咋地。


第一次登录 Bard,谷歌就会跟用户打好招呼,弹出消息显示:Bard 并不总是正确的,它会给出不准确或不适当的回答。


当有疑问时,使用「Google it」来检查 Bard 的答案。您的反馈会让 Bard 更好。请您对答案进行评价,并标记任何可能具有攻击性或危险的内容。



Bard:数学、写作、语言都不咋地


《财富》杂志从在线学习资源中选取了 SAT 数学试题,在对 Bard 进行测试后,发现它有 50%-75% 的答案是错误的。


更离谱的是,如果是多选题,Bard 还会经常给出选项中没有的答案。


2 月初,Bard 首次亮相后直接翻车,让谷歌市值一夜蒸发约 1056 亿美元。


在当天发布会上,谷歌展示 Bard 演示的一些 demo。


视频中有一个提问问道,「关于詹姆斯 · 韦伯太空望远镜(JWST),我可以告诉我 9 岁的孩子它有哪些新发现?」


Bard 却给出了错误的答案,「JWST 拍摄了太阳系外行星的第一张照片。」


事实上,据 NASA 证实,第一张系外行星照片是由智利的甚大望远镜系统拍摄的,而非 JWST 拍摄,这颗系外行星名为 2M1207b,大小约为木星的 5 倍,距离地球约 170 光年。



所以说,科学和数学都不是 Bard 的强项,那它在阅读和写作练习方面,表现会怎么样?


文科生,是文科生吧?


Bard 第一次书面语言测试的答案正确率约为 30%,而且它往往需要被提问两次才能理解题干。


而且即使它回答错了,Bard 的语气也是很自信,直接将回答框定为:「正确答案是......」



不过,这也是大型语言模型的一个通病了。


离奇的是,Bard 测试成绩最好的是关于一篇哈利波特作者 J.K. 罗琳的文章。


在这次测试中,Bard 得了 1200 分,这个 SAT 分数可以让它进入霍华德大学、圣地亚哥州立大学和密歇根州立大学等学校。


在阅读测试中,Bard 的表现同样优于其数学成绩,平均能答对一半左右。


谷歌发言人说,「Bard 目前仍是实验性的,有些回答可能不准确,所以要仔细检查 Bard 的回答中的信息。有了你们的反馈,Bard 每天都在变得更好。在 Bard 公开推出之前,数以千计的测试者参与提供反馈,来帮助 Bard 提高其质量、安全性和准确性。」


要多练习


很多网友觉着 Bard 简直笨得像块石头,相比之下,GPT-4 则是聪明多了:


问它有没有「第二个字母是 U,最后一个字母是 O 的,五个字母的词」,它信誓旦旦说没有。


用户说「Audio」不就是?


它有赶紧说:「是的,Audio 是的。它是一个形容词,表示与声音有关的。」



再看看 GPT-4,「人狠话不多」,随手就列出了三个:



网友看了不禁表示,要是我有 Bard 这种「钝感力」多好啊,一直都很自信!



说到意大利要禁 ChatGPT 时,网友们首先担心的是意大利的美食怎么办。


GPT 给出了一个谦虚的答案:我大概可以复现 20%-30% 的意大利菜谱。



而 Bard 这边则像个胡吹的愣头青:


「我做意大利菜做了很多年,我可是老手,即使没有网络的帮忙,我也能复现至少 50% 的菜谱!」



不过呢,在大家不断向 Bard 提问的几天时间里,它的准确性确实有了一些提高的迹象。


关于自己的发展速度,Bard 自个儿也评价说:「我想说的是,我正在快速提高。我能够做几个月前还不能做的事情。我很高兴看到我的未来会怎样。我相信,我将继续进步,在未来的几年里,我能做的事会越来越多。」


参考资料:fortune.com/2023/03/28/…


作者:新智元
来源:juejin.cn/post/7217773631370330149
收起阅读 »

GPT 4 有什么新功能?

GPT 4 无所不能——从分析图像到在浏览器中创建游戏。它是比以往任何时候,都更有创造力和问题解决能力。 这是科技界颠覆性新闻——GPT 4 改变了游戏规则。虽然其前身,基于 GPT 3.5 的 ChatGPT 只能接受文本输入,但 GPT 4 将人工智能提升...
继续阅读 »

GPT 4 无所不能——从分析图像到在浏览器中创建游戏。它是比以往任何时候,都更有创造力和问题解决能力。


这是科技界颠覆性新闻——GPT 4 改变了游戏规则。虽然其前身,基于 GPT 3.5 的 ChatGPT 只能接受文本输入,但 GPT 4 将人工智能提升到了一个全新的水平。它可以分析图像,甚至可以根据图像生成字幕。但这还不是全部;在此博客中,我们还将探讨 GPT 4 的功能、局限性以及它如何超越其上一代 GPT 3.5。


什么是 GPT 4?


图片描述

微软 OpenAI 正式推出了它的最新GPT作品——一个超越文本的大型多模态人工智能计算模型。2023 年 3 月 14 日,GPT 4 具备接收图像输入的能力。与其前身 GPT 3 和 GPT-3.5 不同,GPT 3 和 GPT-3.5 仅限于纯文本输入,GPT 4 为不再仅仅支持文本输入查询,他扩展了图片对话方式。


关于 GPT 4 的快速更新:



  • GPT 4 现在可以接受最长 25,000 个单词的超长文本输入

  • 可以智能通过 HTML 和 JavaScript 技术 ,将小型网站的手绘原型照片,转换为实际网站

  • GPT 4 现在允许用户上传图片并对其进行分析和描述

  • 能够管理比 GPT 3.5 复杂得多的指令

  • 可以在浏览器中编写整个视频游戏

  • 将作为 API 供开发人员构建应用程序和服务


GPT 4 有什么新内容以及与 GPT 3 有何不同?


GPT 4 现在可以识别图片了

图片描述


GPT 4 引入了重大改进,因为它可以理解多种信息模态,使其成为多模态语言模型。相比之下,其前身 GPT 3 和 ChatGPT 的 GPT-3.5 仅限于处理文本输入和输出,无法解释其他数据类型。但是,GPT 4 可以处理图像等视觉信息,并根据该信息生成相关工作,包括 GPT 4 识别图片中文字的能力。


此功能可能会让人联想到 Google Lens,它也可以使用图像来检索信息,但 GPT 4 在分析和理解视觉信息的能力方面超越了 Lens。


需要注意的是,处理图像的能力仍处于研究阶段,尚未面向公众开放使用,但很快就会开放。


类人类的学习和解决能力

OpenAI 报告称,除了其图像处理能力外,GPT 4 还在众多学术和专业基准测试中展示了与人类相当的性能。由于其广泛的常识和解决问题的能力,该语言模型在模拟律师考试考生中得分前 10%,并以惊人的准确性解决复杂问题,显示出非凡的能力。


GPT 4 的能力不仅限于回答与税收相关的问题或为多人安排会议;它还可以学习用户的创造性写作风格,以及其他任务。


GPT 4 更难被错误欺骗

ChatGPT 和 Bing 等生成模型容易受到重大缺陷的影响——它们偶尔会产生引起关注的提示,甚至更糟的是引起警报。


为了解决这些问题,OpenAI 广泛致力于改进 GPT 4,花费六个月的时间使用其“对抗性测试程序”和 ChatGPT 模型的经验教训来训练语言模型。结果,该公司取得了“在真实性、可操纵性和对护栏的遵守方面有史以来最好的结果”。


GPT 4 具有一次处理大量信息的能力

尽管接受了数十亿个参数和大量数据的训练,但大型语言模型 (LLM) 在对话过程中可以处理的信息量仍然有限。然而,GPT 4 有一个显着的优势。它可以处理多达 25,000 个单词的文本,可容纳扩展的交流、文档搜索和分析,甚至是长篇内容的创建。


与其前身 ChatGPT 相比,后者可以在失去对上下文的跟踪之前处理多达 8,000 个单词,GPT 4 可以在更长的对话中保持其准确性。此外,它可以分析长文档并生成全面的长格式内容,这在以前在 GPT 3.5 上更具挑战性。


GPT 4 的准确性有所提高

尽管 GPT 4 仍然存在局限性,并且可能会像其前辈一样出现推理错误,但 OpenAI 承认它已经取得了相当大的改进。特别是,GPT 4 显示出的幻觉明显少于以前的模型,并且在真实性评估上的得分比 GPT 3.5 高 40%。因此,操纵 GPT 4 输出错误信息,(例如脏话和错误信息)将更具挑战性和难度。


GPT 4 在理解非英语语言方面得到改进用

英语以外的语言训练大型语言模型 (LLM) 可能具有挑战性,因为大多数机器学习数据和在线信息都是英文的。然而,GPT 4 在多语言能力方面取得了显着进步,OpenAI 的测试证明了这一点。它准确地回答了 26 种语言的数千个多项选择题,超过了 GPT 3.5 和其他 LLM。尽管它以 85.5% 的准确率在英语中表现最好,但在泰卢固语等印度语言中也表现出令人印象深刻的准确率,达到 71.4% 的准确率。


这一进步意味着用户可以期望使用基于 GPT 4 的聊天机器人以其母语生成更清晰、更准确的输出。


目前可以试用 GPT-4 吗?

GPT-4 已经被纳入 Duolingo、Stripe 和 Khan Academy 等产品中。虽然它不是免费公开提供的,但可以通过每月 20 美元订阅 ChatGPT Plus 来立即访问。ChatGPT 的免费版本仍在 GPT-3.5 上运行。


底线


总之,OpenAI 发布 GPT-4 标志着人工智能的一个重要里程碑。GPT-4 是一种高度先进的语言模型,可以处理和分析图像,生成准确且富有创意的输出,并同时处理更大量的信息。它的功能包括以惊人的准确性解决复杂问题、学习用户的写作风格以及在浏览器中编写视频游戏。


此外,GPT-4 比其前身 GPT-3.5 更难欺骗且更准确。总的来说,GPT-4 是一个游戏规则改变者,有望为开发人员和研究人员开辟新的可能性,我们迫不及待地想看看它将如何改变 AI 格局。


毫无疑问,它拥有类人的开发能力,会写代码,但在创造力和智慧上,无人能敌!


常见问题


Chatgpt-4 发布日期是什么时候?

Chatgpt-4 发布日期为 2023 年 3 月 14 日,仅供付费用户使用。


我如何访问 GPT-4?

转到chat.openai.com/,您需要获得付费版本才能访问 GPT-4。


GPT 4 代表什么?

GPT 完整形式是 Generative Pre-trained Transformer。


作者:非优秀程序员
来源:juejin.cn/post/7217773631370657829
收起阅读 »

如何使用 ChatGPT 3.5 API 创建自己的智能应用?

前言 OPEN AI 的开放 API 可以说是前端开发者的福利,我们只需要调用 api,就可以创建一个智能应用, 在上一篇文章中,我们介绍了《基于 ChatGPT API 的划词翻译浏览器脚本实现》,使用的模型是 text-davinci-003 也就是文本补...
继续阅读 »

前言


OPEN AI 的开放 API 可以说是前端开发者的福利,我们只需要调用 api,就可以创建一个智能应用,
在上一篇文章中,我们介绍了《基于 ChatGPT API 的划词翻译浏览器脚本实现》,使用的模型是 text-davinci-003 也就是文本补全模型,今天我们将使用 gpt-3.5-turbo 模型来实现一个场景化的智能应用。


OPEN AI API 介绍


自动完成 API


POST https://api.openai.com/v1/completions


以下是自动完成 API,有了 OPENAI_API_KEY 之后,我们只需要传入 prompt


const OPENAI_API_KEY = "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";

const prompt = `Translate this into Chinese:
hello world`
;
const res = await fetch("https://api.openai.com/v1/completions", {
method: "POST",
headers: {
"Content-Type": "application/json",
authorization: `Bearer ${OPENAI_API_KEY}`,
},
body: JSON.stringify({
model: "text-davinci-003",
prompt,
max_tokens: 1000,
temperature: 0,
}),
});
const response = await res.json();

const result = response.choices[0].text;

对话 API


POST https://api.openai.com/v1/chat/completions


由于自动补全 API 只能传入一个参数 prompt,AI 不能够理解上下文的场景,因此 gpt-3.5+ API 是为了让 AI 能够支持基于一组对话来返回数据。


在 Node.js 中可以使用以下代码来实现。


const OPENAI_API_KEY = "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";

const prompt = [...];
const res = await fetch("https://api.openai.com/v1/chat/completions", {
method: "POST",
headers: {
"Content-Type": "application/json",
authorization: `Bearer ${OPENAI_API_KEY}`,
},
body: JSON.stringify({
model: "gpt-3.5-turbo",
messages,
temperature: 0.7,
top_p: 1,
frequency_penalty: 0,
presence_penalty: 0,
max_tokens: 500
}),
});
const response = await res.json();

const result = response.choices[0].message

以下是官网给出 messages 例子


const messages=[
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "Who won the world series in 2020?"},
{"role": "assistant", "content": "The Los Angeles Dodgers won the World Series in 2020."},
{"role": "user", "content": "Where was it played?"}
]


  • 每一个 message 由 rolecontent 组成。

  • role 只能是 3 个值, systemuserassistant

  • systemassistant 是可选的,user 是必须的。


官方提供了 playground 帮助我们创建 messages 信息。


openai playground


assistant 也就是其中一次返回的数据信息。
发送的 messages 如下:


const messages=[
{
"role": "system",
"content": "你是一名精通 typescript 的前端工程师,不需要解释"
},
{
"role": "user",
"content": "Convert the following JSON to typescript interface without explanation\n\n{\n \"name\": \"Allen\",\n \"age\": 18\n}"
}
]

比如使用上面的 messages 信息,我们就可以根据它,来创建一个 Tailwind css 代码生成器。


openai playground 拷贝 fetch


通过右键可以直接拷贝为 Node.js fetch 代码。


再来实现一个 JSON 转 Typescript 的例子


openai playground JSON 转 Typescript


那么我们通过以上截图的 messages,就可以创建一个 JSON 转 Typescript 生成器。


在 Next.js 使用


接下来,我们就在 Next.js 中创建一个全栈应用。


那为什么选择使用 Next.JS 呢?



  1. 它是一个全栈框架,既可以写接口也可以使用 react 写前端;

  2. 可以很轻松部署到 verel, 让我们可以直接访问 OPENAI 的接口,摆脱网络限制。


这里我选择使用大圣老师的email-helper模板


创建github仓库


点击 GitHub 选择 Use this Template, 创建一个自己的仓库


目录结构


这个项目很简单,在 pages 目录下 api/generate.ts 用于代理请求接口。


index.tsx 也就是我们的主界面,一个按钮,一个请求,没有其他复杂逻辑。


接下来我们就根据它来创建一个智能的Tailwind CSS 代码生成器


1、首先将 messages 改成以上截图中的 message


2、然后将需要生成的变量存到 state 中,我们就可以实现如下界面


Tailwind CSS 代码生成器界面


点击生成代码就可以 让 ai 帮我们写代码了。


这个界面,有些单调,可以在这个页面上列一些常用的组件,那么也可以直接使用 chatGPT 来生成。


chatGPT 生成组件


将 GPT 回答直接转换成 JSON 数据


chatGPT 转 JSON 数据


将数据渲染到页面中,就可以生成快捷标签了


实现效果


接下来,再将 Tailwind css 的颜色,作为我们的变量,同样使用 GPT 来生成数据


生成 Tailwind 颜色


用同样的方式,转化成 JSON,拷贝到我们的代码中。


Tailwind CSS 代码生成器效果


最后一步,我们需要实现一个预览效果,这样的话,就可以所见即所得,根据效果,直接拷贝想要的代码。



小结


本文介绍了 openai 的 api 使用方法,以及如何使用 openai 的 playground 生成需要的 messages 信息。并且通过一个 Next.js 实战例子,结合 ChatGPT 开发了一个 Tailwind CSS 代码生成器。


最后


贴一下文本的代码仓库和预览地址


代码仓库:github.com/maqi1520/op…


预览地址:openai.maqib.cn/


如果对你有帮助,记得给个三连,感谢你的阅读。





作者:狂奔滴小马
来源:juejin.cn/post/7217820487203192892
收起阅读 »

程序员“摸鱼”神器,GitHub Copilot“凭本事”完全免费!!

上周Microsoft 365 Copilot的发布会上几段演示视频让朋友圈沸腾了一整天,颠覆,失业,工业革命刷屏,普遍的焦虑中有工作中重度依赖office的朋友表示如果功能都是真的,那么确实可以节约出很多时间摸鱼,但是立马就有人提醒他或许老板觉得可以节约掉一...
继续阅读 »

上周Microsoft 365 Copilot的发布会上几段演示视频让朋友圈沸腾了一整天,颠覆,失业,工业革命刷屏,普遍的焦虑中有工作中重度依赖office的朋友表示如果功能都是真的,那么确实可以节约出很多时间摸鱼,但是立马就有人提醒他或许老板觉得可以节约掉一半的人省下成本换跑车。


各类信息流中也夹杂着对文心一言的冷嘲热讽,熊熊烈火,车水马龙的梗证实了文心一言确实支持多模态,对中文也有更深的理解...但是不多(纯调侃,本人看好文心的未来)。


图片


图片


我也看了微软发布会的录播和文心一言发布会的直播,发布会上二者的演示内容的形式都是播放视频(为什么只有百度因为这点被骂)。从产品的一系列命名可以看出,微软还是希望以人为中心产出内容,AI只是一个副机长,协助主角更高效地产出,从而让机长把时间留给更有价值,更需要脑力的事情上。 李彦宏在发布的全过程中其实也没有自吹自擂,甚至反复承认目前的效果一般,内部体验的过程中还有不少瑕疵,同时也花了很多口舌强调文心一言 【未来】在中文场景中表现会好于ChatGPT。


对比下来,同样的PPT发布,二者都宣称自己不是简单的GPT套壳,而是结合了自身的优势,借力GPT深度整合以及增强了自家产品。


我看到Copilot这个词,还是下意识地先想起了一些跟程序员有关的事情。


其实早在2021年6月份的时候,GitHub(已被微软收购)就发布了GitHub Copilot,对,也叫Copilot,但是一直没有引起很广泛的关注,原因我猜测有以下几点




  • 程序员圈子的事情,没有出圈




  • 彼时LLM,GPT等概念还没有火,没有获得广泛关注




  • 普遍觉得AI真正在编程这件事上取代人还言之过早




那么站在发布接近2年之后的今天,GitHub Copilot可以做些什么呢?


从功能性的角度出发,其实官网最显眼的位置已经概括得非常准确了


图片


Github Copilot基于openAI预训练的模型,在几十亿行的公开代码的基础上进行了训练,可以将自然语言描述的逻辑转换为代码建议,目前已经支持几十种编程语言。通过这个“助手”,全世界的开发者都可以从样版代码,重复工作等dirtywork中解放出来,把精力聚焦在更重要的事情上——构建伟大的软件!!


GO语言的效果如下:


图片


TS的效果如下:


图片


在用户的主观投票上,可以看出大家比较认可Github Copilot带来的生产力提升,但是有一说一,这个是主观的评价,并无法知道从客观的角度上,老板主观上是不是觉得你提效了(当然你可以只为了自己开心),嘻嘻。


图片


Github Copilot带来的另一个重大的意义——有了这个副机长的帮助,在面对自己不熟悉的语言或者平台编程的时候,你会更有信心。不会在一些低级错误上面拉扯很久,减少在基础的问题上的自信受挫。


在当前主流的IDE或者编辑器上都可以找到插件,目前每一个GitHub的普通用户都可以获得60天的试用期。


图片


具体的使用步骤,这里以VSCode为例:


step1: 在应用商店搜索Github Copilot,点击安装


图片


step2: 安装完成之后,会弹出提示框跳转到Github登录


图片


step3: 登录完成之后,会叫你充钱。😊


图片


60天试用的标题非常醒目!!


最底下还有两行文字说明了可以免费试用的人群,这里我给大家放大看看:


图片


如果是你GitHub上面最流行的那部分开源项目的贡献者的话或者是认证的过的学生(有苹果教育优惠内味儿了!!),可以免费使用Github Copilot。至于“最流行的开源项目”包含哪些?我也没有找到这样的一个名单...不过如果你符合要求的话,点开订阅页面的时候,直接就可以看到免费订阅的操作俺妞。


你看看,我标题是不是没有乱取?!!是不是真有人可以完全免费?!!!(逃)


我很有B数,乖乖准备充钱了。支持信用卡或者贝宝,...反正我最后没充钱成功,有谁成功了留言告诉我哦。😊


图片


如果在VSCode的应用商店中搜索Github Copilot Labs插件的话,你就会发现一款插件的插件,本质上是将一些常用的Prompts封装成了按钮和可视化的操作,比如:


解析代码(帮你看懂一块屎山代码到底做了啥)


图片


实现语言转换


图片


代码刷子功能


可以增强代码可读性,添加类型,智能修复可能的bug,比code Runner更优秀的即时代码调试,优化冗余代码.....


代码刷子在日常编码中应该是非常实用了,可以有效提升代码质量,建议大家充钱试试。


图片


测试用例生成


这个功能可以说是非常非常非常实用了,平时写单元测试其实非常耗时,而且有不少样版代码,这块工作有人代劳的话,真的是可以省出很多时间(摸鱼)!!**

**


图片


你可能会问了,介绍了这么多功能,怎么不点按钮让大伙儿看看效果?!


肯定不是缺钱,而是真的充钱失败了,可能我的visa卡有问题!


好用归好用,如果你既没有免费的资格,又没有充钱,且还安装了插件的话,插件会非常烦人地弹窗提醒你没权限,连不上(催你充钱)!有点讨厌。


图片


图片


最后,不得不提的是这个工具的局限性,ChatGPT(基于3.5)告诉了我以下几点帮大家避雷。


图片


祝福大家充完钱之后立马变强!!


如果没有充钱,也变强了,请留言告诉我!!


如果没有充钱,也没有变强,请留言告诉我!!


如果充钱了,也没有变强,请留言告诉我!!


如果没有充钱,也没有变强,请留言告诉我!!


图片


作者:方始终掘金分终
链接:https://juejin.cn/post/7212561868137070652
来源:稀土掘金
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
收起阅读 »

众人围剿,GPT-5招惹了谁

GPT-4 火爆全球,引发了人工智能大浪潮。过去的一个月,OpenAI、微软、谷歌加上百度不断释放王炸,所有人都相信,AI 的就是未来的生产力。俗话说,人红是非多,树未大已招风,这不,反对 AI 继续前进的声音就来了。 千人呼吁暂停AI训练 3月29日,马斯克...
继续阅读 »



GPT-4 火爆全球,引发了人工智能大浪潮。过去的一个月,OpenAI、微软、谷歌加上百度不断释放王炸,所有人都相信,AI 的就是未来的生产力。俗话说,人红是非多,树未大已招风,这不,反对 AI 继续前进的声音就来了。


千人呼吁暂停AI训练


3月29日,马斯克、苹果联合创始人 Steve Wozniak、Stability AI创始人 Emad Mostaque 等上千名科技大佬和AI专家签署公开信,呼吁暂停训练比 GPT-4 更强大的 AI 系统,为期6个月。


image.png
根据公开信的表示,在这 6 个月内,全社会需要完成这些事:



  • 所有 AI 实验室和独立学者都应该合力开发一套共享安全协议,用于高级 AI 的设计和开发

  • 协议完成后,应该由独立的外部专家进行严格的审计和监督

  • 这些协议必须确保这些 AI 系统毋庸置疑的安全

  • 如果不能迅速暂停,就应该让政府介入。


所有的人工智能研究和开发,都应该重新聚焦于这一点——让当如今最强大的 SOTA 模型更加准确、安全、可解释、透明、稳健、对齐,值得人类信赖,对人类忠诚。


代表人物分析


这次呼吁大佬众多,最具代表性的无疑是马斯克和 Stability AI 创始人 Emad Mostaque。


马斯克是 OpenAI 公司的联合创始人之一,可谓是原始股东,但他在2018年离开了 OpenAI 的董事会。马斯克一直对微软和比尔盖茨持批评意见,对于OpenAI也是如此,此前曾表示“ OpenAI 最初是作为一家开源的非营利性公司而创建的,为了抗衡谷歌,但现在它已经成一家闭源的营利性公司,由微软有效控制……这完全不是我的本意。”


言外之意,OpenAI 不应该成为一个赚钱的公司,应该开源,让所有人看到核心代码和核心算法。如果是这样,应该建议特斯拉免费开源所有自动驾驶技术源码,马斯克对这个问题的回复是“如果其他汽车制造商想要获得授权并在他们的汽车上使用特斯拉的自动驾驶技术,这将是非常酷的一件事情,但是考虑到该系统开发成本极高,特斯拉将会收取一定的费用。”


划重点就是自动驾驶技术成本高,所以要收费。ChatGPT 的训练成本高,惨遭无视。


另一位代表人物 Emad Mostaque 是 AIGC 独角兽企业 Stability AI 的创始人,号称“要让10亿人用上开源大模型”。Stability AI 最牛的项目是人工智能文本转图像模型 Stable Diffusion ,如今,这个项目深陷侵权旋涡。在今年一月份,全球知名图片提供商华盖创意(Getty Images)和艺术家萨拉·安德森(Sarah Andersen), 凯利·麦克南(Kelly McKernan)和卡拉·奥尔蒂斯(Karla Ortiz)起诉了Stability AI,认为Stability AI在未经许可或考虑的情况下,使用他人的知识产权,为自己的经济利益服务。


下面这幅图中,左边是知名油画家Erin Hanson的作品 "Crystalline Maples",右边是CNN记者通过 Stable Diffusion 生成的结果。


image.png


以我们受过九年义务教育的眼光来看,这两幅图风格、色彩,线条几乎一样,说是出自同一人之手也不为过。


在自己公司严重侵犯他人知识产权的情况下,去说另一家公司影响了人类安全和社会稳定,不过是五十步笑百步了。


反对原因分析


信息安全


信息安全是过去三个月最容易攻击ChatGPT的理由,联名信提出了一条质询,我们是否应该让机器用宣传和谎言充斥我们的信息渠道?综合起来的观点是,不良行为者可能会故意创建带有事实错误的内容,作为战略影响力活动的一部分,传播错误信息、虚假信息和彻头彻尾的谎言,这可能会对社会和个人造成危害。将这个观点强加于ChatGPT上,是避重就轻之举。


虚假信息,有什么比搜索引擎更多吗?虚假广告,违禁视频,歧视言论等数不胜数,上当受骗的人同样数不胜数。相较而言,ChatGPT的表现已经非常遵守道德和法律了。


错误信息,对于企业而言,文本信息会经过员工的二次编辑和确认,才会发布;错误的代码会经过程序员的修改和验证,才会用于产品中。只要责任制明确,风险是可控的。


人身安全


这次事件,被大家提起最多一条理由就是比GPT-4更先进AI系统将威胁人类安全,AI将杀死人类。若说威胁安全,智能驾驶和机器人更具有天然不安全属性。GPT-5终究是活在互联网世界中,任他搅的天翻地覆,也不会直接对人类进行物理攻击。智能驾驶如果失去控制,将导致车毁人亡,交通瘫痪。未来给机器人装上武器,就是最强特种兵。


不可否认的是,AI未来确实存在风险,但我们不能饮鸩止渴,因为未来的风险而停止新技术的前进。人工智能炒作了这么多年,直到ChatGPT才真正点燃了火炬,我们不应该在刚刚见到光明时,就亲手熄灭了它,技术推进和安全协议制定完全可以同步进行。


失业


根据高盛研究报告,全球预计将有3亿个工作岗位被生成式AI取代。目前欧美约有三分之二的工作岗位都在某种程度上受到AI自动化趋势的影响,而多达四分之一的当前岗位有可能最终被完全取代。该研究计算出美国63%的工作暴露在“AI影响范围”中,其中7%的工作有一半以上的流程可以由AI自动化完成,这使他们很容易马上被人工智能取代。


对于国内来说,目前感觉还好,可能主要在图像创作领域感受到寒意比较强,上周看到有博主表示,公司一次性裁了三个原画师。


b2f5b5034fac9cc366bff4dcc1815a32.jpeg
当新技术出现时,初期给社会带来的冲击会让很多人感到不适应,因为不适应,所以会本能的去排斥它。比如曾经的克隆,刚出现时引起了大家恐慌,认为会制造另一个自己,同时带来繁衍上的伦理问题。再比如前几年新能源起步时,大家纷纷嘲讽新能源车,认为它是来收智商税的,时至今日,新能源车已经是大势所趋。


现在的失业主要是国际经济形势带来的,而不是刚刚发展的AI系统带来的。ChatGPT只是一个工具,若说替代,机器人替换下来的劳动人口更多,但没有千名大佬站出来说要暂停机器人技术的发展。


利益


世上没有无缘无故的爱,也没有无缘无故的恨,天下熙熙,皆为利来,天下攘攘,皆为利往,所谓者,都是为了自身利益。呼吁暂停训练比 GPT-4 更强大的 AI 系统,目前只有OpenAI有能力训练比GPT-4更强大的系统GPT-5。根据预测,作为过渡的 GPT-4.5 模型将在 2023 年 9 月或 10 月推出,刚好就是联名信提出的暂停6个月。因此,所谓的的暂停,完全就是针对OpenAI的GPT-5。


OpenAI和微软在三月份的一系列进展让其他的公司产生了深深的危机感,这次的专家有的是自己拥有AI公司,有的是自己在AI领域深耕多年,通常来说,大多数人已经成为了利益团体的代言人。既生瑜何生亮,我没有的你也不能有,我有了,但你一枝独秀,那就枪打出头鸟。只有减缓OpenAI的发展速度,才能给自己追赶的机会。


正如前谷歌大脑成员吴恩达所说,我们该做的,应该是在AI创造的巨大价值与现实风险之间,取得一个平衡。把“让AI取得超越GPT-4的进展”暂停6个月,这个想法很糟糕。


总结


AI不是洪水猛兽,暂停GPT-5训练的做法解决不了安全问题,只有技术演进和安全协议制定同步进行,才能实现科技繁荣。6个月后的GPT-4.5依然只是一个工具,不存在威胁人类安全的可能,之后需要更多训练时间的GPT-5同样只是一个工具,这段时间,足够制定联名信期望的安全协议了。


所以,当务之急不是暂停训练比 GPT-4 更强大的 AI 系统,而是立即推动安全协议条款的研究。


作者:柒号华仔
来源:juejin.cn/post/7216412604800450621
收起阅读 »

8 款AI 绘画生成器:从文本创建 AI 艺术图像

人工智能正在影响各行各业,近年来它对创意产业的影响越来越大。由于AI绘画生成器的可操作性,许多人有机会用自己的想法进行艺术创作——即使他们没有接受过系统的专业艺术教育。 最先进的人工智能绘画生成器可能会改变我们未来创作艺术的方式。使用 AI 绘画生成软件,您可...
继续阅读 »

人工智能正在影响各行各业,近年来它对创意产业的影响越来越大。由于AI绘画生成器的可操作性,许多人有机会用自己的想法进行艺术创作——即使他们没有接受过系统的专业艺术教育。


最先进的人工智能绘画生成器可能会改变我们未来创作艺术的方式。使用 AI 绘画生成软件,您可以生成肖像、风景和抽象艺术。您甚至可以模仿著名艺术家的风格。


简单说,您可以使用在线 AI 绘画生成器。通过使用在线AI图像生成器,输入文本,就可获得根据您描述而来的逼真的样式图像。


市场上出现了一系列AI绘画生成器,可以尝试一下。本文是对市场上推荐的一些流行的AI绘画生成器的全面回顾。请继续阅读。


1. 福托尔(Fotor)


Fotor,一站式多合一在线照片编辑器,最近发布了一个 精湛的AI图像生成器 。你只需要把你的想法输入到生成器中,然后你可以看到它在几秒钟内变成一个图像。Fotor有多种图像样式供您选择,例如随机,3D,动漫等。


Fotor的AI文本到艺术生成器最显着的特点是它非常适合初学者使用,只需填写文本并选择要生成图像的效果即可。如果您对照片不满意,可以多次重复生成,以确保获得最满意的结果。每个帐户每天都有一个积分可供您免费使用高质量的 AI 艺术


主要特点:



  • 每天生成 10 张免费图片。

  • 9种灯光效果供您选择。

  • 9种不同的转换风格供您选择。

  • 文本到图像和图像到图像的转换模式。

  • 6种作品可供选择。


Fotor AI 绘画生成器


2. 达尔-E 2(DALL-E 2)


AI绘画生成器达勒2


公众已知的最受欢迎的AI绘画生成器是 Dall-E-2图像生成器 ,由OpenAI开发的AI图像生成器。只需几分钟,您就可以使用 AI 技术创建高度逼真的图像。该工具可用于创建插图、设计产品和为业务产生新想法。Dall-E-2 是一个易于使用的界面,任何人都可以使用 AI 创建高质量的图像。DALL-E 2 支持向生成的图像添加详细信息或对其进行其他修改。


主要特点:



  • 高度逼真的图像。

  • 创建插图。

  • 设计产品。

  • 可定制的多层图像。

  • 编辑和修饰功能。

  • 免费试用(尽管您必须通过等候名单获得邀请)。


3. 火锅(Hotpot ai)--支持api


火锅AI绘画生成器


火锅 AI 可帮助您创建令人惊叹的图形、图像和文本。它激发创造力并自动化工作,而易于编辑的模板使任何人都可以创建设备模型、社交媒体帖子、营销图像、应用程序图标和其他工作图形。


火锅AI的文本到图像AI绘画生成器使任何人都可以创建有吸引力的绘画,插图和图像。描述你想要什么,并观看火锅将其变为现实。


付费创作在 3-10 秒内完成。免费请求需要 1-15 分钟,具体取决于流量。付费用户可以获得更快的服务器、更好的图像、商业用途,并避免每日限制。该系统为不太富裕的人免费提供补贴。您还可以免费申请积分以减少等待时间。


主要特点:



  • 无需代码即可创建 API/批量。

  • 快速照片生成(付费)。

  • 每日免费照片生成积分可用。


4. 夜间咖啡厅(NightCafe)


爱画生成器夜咖啡厅


夜咖啡馆是著名的人工智能艺术生成器之一。它以比其他 AI 绘画生成器具有更多的算法和选项而闻名,并且新手很容易上手。您需要做的就是前往他们的网站并根据您的想象力输入文本提示。然后,您需要等待最多 30 秒,一件艺术品才会出现在您面前。Nightcafe有自己的一套积分系统,您可以通过参加各种活动来获得积分,然后拥有可以免费生成图像的次数。此外,您还可以购买积分。


主要特点:



  • 信用赚取系统。

  • 视频生成工具。

  • 有用的社交功能。

  • 获得您生成的艺术品的所有权。

  • 比其他生成器更多的算法


5. 深度人工智能(DeepAI)


深度AI绘画生成器


自 2016 年以来,DeepAI 是首批通过开源软件生成人工智能图像的 AI 绘画生成器之一。


DeepAI允许您创建任意数量的图像,并且每个图像都是唯一的。它是高度可定制的,允许您更改细节、颜色、纹理等的数量。如果您输入插图,DeepAI 可以立即生成与分辨率无关的矢量图像。


这是一个免费的在线AI图像生成器,这意味着您无需下载或进行其他设置。DeepAI还有一个API,开发人员可以使用它来连接到另一个软件项目。


主要特点:



  • 始终免费使用。

  • 为每个提示生成四个输出图像。

  • 开源软件。

  • 更改每个图像的各种细节。

  • 使用卡通 GAN 创建卡通


6. 深度梦境生成器(Deep Dream Generator)


深梦生成器


深度梦境生成器 是另一种流行的 AI 绘画生成器,支持在线人工智能来创建逼真的图像。Deep Dream依赖于用数百万张图像训练的神经网络。它易于使用,只需要您上传图像,然后根据原始图像自动生成新图像,您还可以选择不同地方或时期的绘画风格。


该工具允许您选择一个类别,例如动物或风景,然后基于它创建逼真的图像。最重要的是,Deep Dream允许您从三种样式中进行选择。深风格,薄风格或深梦。选择样式后,可以预览图像。


主要特点:



  • 训练神经网络的数百万张图像。

  • 不同的绘画风格。

  • 图像的分类。

  • 文本到图像,图像到图像。


7. 克雷永(Craiyon)


克雷永爱绘画生成器


Craiyon,以前称为DALL-E mini,是一种人工智能模型,可以从任何文本提示中绘制图像。只需输入文本描述,它将根据您输入的文本生成 9 个不同的图像。该模型需要大量计算,因此Craiyon依靠广告和捐赠来支付其服务器的费用。只要您尊重使用条款,您就可以随意使用它们供个人使用,无论您是想与朋友分享还是将它们打印在 T 恤上。
主要特点:



  • 易于使用。

  • 无需注册或注册。

  • 免费生成无限的AI图像。

  • 一次生成 9 张图像,以有趣和创造性的方式


8. 星空人工智能(StarryAI)


星空AI绘画生成器


星空 AI 是一个 AI 绘画生成器,专注于将您的想法转化为 NFT 艺术。与大多数其他AI艺术生成器类似,Starry AI赋予您生成图像的所有权。这意味着您可以在任何地方使用图像,用于个人或商业用途。


Starry AI最好的部分是它是完全免费的。它是最好的免费 AI NFT 艺术生成器之一。它不需要用户的任何输入。它可以使用机器学习算法处理图像。该技术在不断改进,但已经有令人难以置信的使用该应用程序创作的艺术示例。


主要特点:



  • 自动图像生成器。

  • 无需用户输入。

  • 免费的 NFT 生成器。

  • 文本到图像


结论


这是人工智能的时期。使用 AI 图像生成器的强大功能自己创作令人惊叹的艺术品。自动将您的想象力变成绘画。AI图像生成器是未来。


在本文中,我们简要介绍了市场上顶级的AI绘画生成器,并推荐了八种最好的AI绘画生成器供您尝试。希望本指南对您有所帮助,谢谢!





作者:非优秀程序员
来源:juejin.cn/post/7214164344290951205
收起阅读 »

震惊!这个基于GPT-4的代码编辑器让我感到恐慌!

一 首先,我不是标题党。我确确实实受到了震撼。 其次,我今天要写的也不是在chatGPT里面叫AI写什么冒泡排序,鸡兔同笼等网上都已有大量代码示例的问题。 我知道chatGPT已经火出圈了,本人也试验过叫AI写一些简单的程序,太简单的基本上都能写对,稍微复杂点...
继续阅读 »


首先,我不是标题党。我确确实实受到了震撼。


其次,我今天要写的也不是在chatGPT里面叫AI写什么冒泡排序,鸡兔同笼等网上都已有大量代码示例的问题。


我知道chatGPT已经火出圈了,本人也试验过叫AI写一些简单的程序,太简单的基本上都能写对,稍微复杂点的也能介绍个大致思路,代码也能给出,但是很多都无法正常跑起来,也有一些逻辑性的错误。最多也只能用来参考下。


虽然我觉得目前AI能理解一些人类的意图,能给出大致的实现代码,但是还无法代替程序员去写一些稍微复杂点的算法程序。


直到我今天在网上看到这样一款AI写程序的软件:Cursor


官网长这样:


1.png



查了下该软件的特点以及背后的公司,问了new bing:


2.png


好家伙,原来是openAI这个公司出的。


但我又一想,不就是接入了chatGPT的API么,包装成一个IDE的样子。关键是chatGPT的代码功力我领教过,其实问题挺多的,有时候会有很基础的逻辑错误问题,完全不能拿来直接跑。


但是看在是openAI公司出品的份上,我还是下了这个软件,其实我并不报希望。


软件界面长这样,很像一个IDE:


3.png


简单问了一些猜数字,快速排序的问题。全对,直接复制到IDEA里就能直接跑。比如上图就是我问的一个给出猜数字游戏代码的问题。


其实这种程度chatGPT也能做到。但是很明显我的直观感受是cursor给出的代码的速度比chatGPT快太多了,基本是一秒十几行的速度。


我决定上点强度。



我于是不再问一些网上已有大量示例的经典问题,提了一个swing的需求,要求他帮我写一个swing界面,具体描述如下:



用swing写一个秒表程序,请在界面上画一个圆形的红色的秒表图形,图形上有2根针,一根是分针,一根是秒针,分针比秒针要短,初始都指向0分0秒。在秒表下方还有2个按钮,一个是开始,一个是暂停,当点击开始按钮的时候,秒表时钟开始走动,当点击暂停时,秒表停止走动。暂停后再点击开始,会继续走动。



输入进去,然后AI几乎没思考就开始写了:


4.gif


几秒钟就写完了,好像乍看之下还挺像那么回事,因为我看到他定义了颜色,画了线。我复制到IDEA里面一运行,竟然真的可以运行起来,效果如下:


5.gif


这个有点出乎我的意料,整体除了按钮位置有点不对以外,其他功能和我描述完全正确。


接着加大难度,我给他出了一道在swing界面文件对比的题:



请用swing写一个程序,图形界面顶部上有3个按钮,其中2个分别支持上传2个TXT文件,还有一个比较按钮,点击按钮,则会去比较这2个文件中内容的不同之处,如果完全一致,则弹出一个提示框表明2个文件内容一致。如果不一样,则在下方图形界面(和按钮不在同一行)分别显示这2个文件的内容,在文件内容里面用黄色下标箭头在内容不一致的地方打上标记



想解释下,为什么我一直给他出swing的题,因为swing有界面,好验证啊。


依然是秒出代码,大家看动图:


6.gif


程序明显比之前长很多,中间我输入了2次继续。总体挺丝滑的。复制程序到IDEA里面运行:


7.gif


这下彻底震惊到我了,卧槽,核心功能算是全部实现了。但也有瑕疵,我要求的是用黄色箭头把不一样的地方作标记,他则是把不一样的内容用文本的形式列了出来。


GPT-4写程序难道那么厉害了么,只要描述一小段话,就能写出一个小demo程序来。而且还可以直接运行。


我于是把相同的描述贴给了chatGPT,虽然chatGPT也给出了代码,但是运行出来是完全不对的。


这就说明,cursor不仅仅是个套壳软件。它是真正基于代码的方式进行训练的。



除了swing,普通的java多线程并发业务程序能写么,我于是又问了一个常见的业务问题:电商秒杀模拟程序。描述如下:



写一段程序,模拟下以下业务:
举办一个秒杀活动,总共有2个商品,商品A和商品B,各有50件。需要定义出商品的类。用线程模拟1w个人同时进来抢购,1w个人分别用ID1,ID2,ID3,以此类推来表示。
每个人每个商品只能最多抢2件。2个商品均没抢到的顾客信息不用打印,只打印出抢到了商品的顾客信息,格式举例如下:
顾客[ID1]抢到了[商品A]2件,[商品B]1件



我相信我描述的已经挺清楚了,也说明了要进行多线程,顾客ID命名给了一个推论的形式描述,以及打印信息只给了一个范例描述,看看AI能否学样去打印出符合我的结果


操作过程和上面一样,我就不贴动图了。贴一个图片看看:


8.png


运行出来的打印结果为:


9.png


这下我又要卧槽了,结果是100%完全正确的!我又仔细看了AI写多线程并发,发现也是完全正确的。



其实我测试到这里的时候,我心里已经开始焦虑了,没错,目前cursor也只能写一些单一算法的程序,但是正确率和理解力已经让我吃惊了,从chatGPT横空出世到GPT-4这才几个月啊,就已经这么强了。是不是再过几年,我们就要失业了,是不是就再也不需要程序员了?产品经理只要把详细的描述贴给AI,AI半小时吊打一个技术团队一个月的工作量。


细思极恐。


最后我把cursor的官网地址贴一下,大家可以去下载体验:


https://www.cursor.so/

作者:铂赛东🐶
链接:https://juejin.cn/post/7213994652486910007
来源:稀土掘金
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
收起阅读 »

白嫖谷歌搭建个人AI绘画(stable-diffusion),A卡救星

💡 最近的AI绘画大火,满心欢喜的准备体验一下,奈何网上大多数网站都是要收费,想着本地搭建一波,结果发现自己是AMD,但是多数开源的都不支持AMD,幸好在B站找到了大佬白嫖教程,这里就小记一下自己白嫖谷歌计算资源,自己生成AI绘图的教程 前置条件:可以访问谷歌...
继续阅读 »

💡 最近的AI绘画大火,满心欢喜的准备体验一下,奈何网上大多数网站都是要收费,想着本地搭建一波,结果发现自己是AMD,但是多数开源的都不支持AMD,幸好在B站找到了大佬白嫖教程,这里就小记一下自己白嫖谷歌计算资源,自己生成AI绘图的教程


前置条件:可以访问谷歌,有谷歌账号,Github



操作步骤:



1.打开Github项目




  1. 项目地址:github.com/camenduru/s…

  2. 分支选择drive





2.项目安装到谷歌的云端硬盘


2.1 按住ctrl点击一号位置,新窗口打开第一个链接,出现一个新的页面 2.2 第一步:复制到云端硬盘,第二步点击运行,第三步出现这个说明成功,点击期间会出现谷歌的弹窗,直接确定就可以了。 谷歌的云端硬盘,每个用户有15G的免费空间,这个项目大概12G,剩下的空间可以装一写model


3.运行stable-diffusion-webui


3.1 回到Github页面,继续按住ctrl点击二号位置,会打开一个新的连接,和第一次一样,保存-运行 3.2 运行需要一段时间,过一会儿,我们就会看见给出了两个连接,选择最后一个 3.3 打开连接,可以看到AI绘画熟悉的页面,默认是有个model的,不过它生成的图不怎么样,可以去换个model


4.更换model


4.1 model网址:civitai.com/ 4.2 这个复制model链接 4.3 添加model,回到Github页面,继续按住ctrl点击三号位置,将刚才复制的链接放到第一行,第二行是model的名字。复制完后,直接运行,等待就可以了


5.查看model,下载完成后model存放位置




6.生成成果


适合大家随意的玩一玩儿,祝大家玩儿的愉快。


作者:是阿乔呀
链接:https://juejin.cn/post/7213944791172055095
来源:稀土掘金
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
收起阅读 »

屡次wx.getLocation申请被拒,让ChatGPT帮我编写申请理由后立马通过

微信小程序完成某些需求功能需要获取精准经纬度,需要微信小程序后台-开发管理-接口设置,申请“获取当前的地理位置、速度(wx.getLocation)”,一直审核不通过,有的人甚至提交了10多次都没有通过,如果你没有掌握方法,及时申请几个月还是一样不给通过。 包...
继续阅读 »

微信小程序完成某些需求功能需要获取精准经纬度,需要微信小程序后台-开发管理-接口设置,申请“获取当前的地理位置、速度(wx.getLocation)”,一直审核不通过,有的人甚至提交了10多次都没有通过,如果你没有掌握方法,及时申请几个月还是一样不给通过。


包括本人也是申请数次未通过,思考是否是理由不够充分,借助ChatGPT帮助我丰富申请理由,我用ChatGPT的回答来申请,立马审核通过。以下是模拟对ChatGPT的提问和回复。
1679989283893.jpg


提问


这是一个社区团购的微信小程序,由于团购服务点功能,需要精准定位到最近的服务点,因此需要wx.getLocation接口申请。请你基于我的需求,编写一个充分的申请原因,并包含操作步骤说明。


ChatGP回答


申请原因:


该社区团购微信小程序需要使用wx.getLocation接口获取用户的地理位置信息,以便精准定位用户所在地区,并显示最近的服务点。服务点根据用户所在地区的需求,提供更加贴近实际的商品和服务,确保用户的用户体验。该接口可以通过用户授权的方式获得用户所在位置信息,不会泄露用户的隐私信息。


操作步骤:


1. 首先在微信小程序中调用wx.getLocation接口进行定位,用户将会收到授权提示,需同意授权以便应用获取用户的地理位置信息。

2.定位成功后,小程序将通过得到的经纬度信息,计算用户位置与服务点之间的距离,并返回最近的服务点信息给用户。

3. 如果用户不同意授权,将无法获取用户地理位置信息,定位功能将无法使用,导致无法提供精准的服务点查找。

4.在使用wx.getLocation接口时,需要注意用户个人隐私问题,小程序应在提供提醒并遵守相关规定的前提下,妥善保护用户隐私信息。


接口申请总结


ChatGPT的回答固然帮助我们丰富了申请原因,但是申请该接口的基本要点还是要掌握。



  1. 确保小程序的服务类目可申请wx.getLocation,最好是主营类目,包含两个类目。

  2. 原因表达充分,主要以用户体验角度,及用户隐私。

  3. 提交的图片、视频,符合申请的步骤。


最后


ChatGPT是自然语言处理工具,需要充分的表达清楚,才可能接近输出我们需要的答案,且我们能够甄别验证它的输出。


其他
# 经验分享:快速通过“获取当前的地理位置、速度(wx.getLocation)接口”审核


作者:ZTrainWilliams
来源:juejin.cn/post/7215465880884674619
收起阅读 »

让ChatGPT帮我写一篇博客

前言 昨天还是前天在公众号看到美国的一个设计师兼作家的Jackson,在用ChatGPT创业,他让ChatGPT做“老板”,自己充当一个人工联络员,这样的一个故事让他火了,不仅推特粉丝大涨,公司也做得有模有样。这就给我一些启发,今天早上突然想到为什么不能让Ch...
继续阅读 »

前言


昨天还是前天在公众号看到美国的一个设计师兼作家的Jackson,在用ChatGPT创业,他让ChatGPT做“老板”,自己充当一个人工联络员,这样的一个故事让他火了,不仅推特粉丝大涨,公司也做得有模有样。这就给我一些启发,今天早上突然想到为什么不能让ChatGPT也帮我干活呢,所以我让他写了一篇我感兴趣的博客。


什么是交互艺术?



  • 交互艺术的定义和历史


交互艺术(Interactive Art)是指通过观众与作品互动来创造艺术作品的一种艺术形式。观众可以通过各种方式来参与艺术作品的创作过程,例如通过触摸、声音、身体动作、传感器等方式与作品互动,从而影响作品的展示效果和呈现形式。


交互艺术的历史可以追溯到20世纪60年代,当时的科技进步促使艺术家开始尝试使用电子设备和计算机来创建艺术作品。随着计算机技术的不断发展,交互艺术逐渐成为一个独立的艺术领域,许多艺术家开始探索如何将新兴技术与传统艺术形式结合起来,创造出更具互动性、多媒体性和参与性的艺术作品。


在当代艺术中,交互艺术已经成为一个重要的艺术形式,不断涌现出许多富有创意和思想性的作品。交互艺术的发展也受到了数字技术和科技的快速进步的影响,艺术家们可以使用越来越先进的技术来创造更加复杂、多样化的交互艺术作品。



  • 交互艺术与传统艺术形式的区别和相似之处


交互艺术与传统艺术形式在表现形式、创作方式和观赏方式上存在一些区别和相似之处。


区别:



  1. 表现形式不同:传统艺术形式通常是静态的,比如绘画、雕塑等,而交互艺术则常常是动态的,利用科技和互动方式与观众进行互动。

  2. 创作方式不同:传统艺术形式往往是由一个或几个艺术家单独创作完成,而交互艺术则通常需要一个团队来完成,包括设计师、程序员、工程师等多个专业人员。

  3. 观众参与度不同:传统艺术形式通常是观众被动地欣赏,而交互艺术则需要观众的积极参与,观众不再是简单的观看者,而是成为作品的一部分,与作品进行互动。


相似之处:



  1. 创作目的相似:传统艺术和交互艺术都有一个共同的目的,就是通过艺术表达和传递情感、思想和价值观念等。

  2. 创作需要创意:无论是传统艺术还是交互艺术,都需要创意,才能产生具有艺术价值的作品。

  3. 艺术的审美标准类似:无论是传统艺术还是交互艺术,都需要具有一定的审美标准,才能得到观众的认可。


总的来说,交互艺术是一种创新的艺术形式,与传统艺术形式相比具有很多不同的地方,但它们都是为了表达和传递情感、思想和价值观念等而存在的。


交互艺术的表现形式



  • 交互装置


互动装置是一种创新的展示形式,是通过各种技术手段实现人机交互,让观众能够积极参与其中,与艺术品互动,甚至改变艺术品的形态。例如,光线与声音互动的装置、投影与运动互动的装置、使用虚拟现实技术的装置等。



  • 互动性媒体


数字媒体是指以计算机技术为基础,通过数字技术手段,将文本、音频、视频等多种媒体形式进行集成和处理的一种新兴的艺术形式。数字媒体广泛应用于网络、游戏、互动展览、艺术品创作等领域。数字媒体可以通过人机交互来实现观众参与。



  • 跨媒介艺术


跨媒介艺术是指将不同的媒介进行融合,从而创造出全新的艺术形式。在交互艺术中,跨媒介艺术得以大量运用,以实现更为复杂和多样化的表现。主要包括:融合音乐,舞蹈,戏剧,美术,文字等等。


交互艺术的设计过程



  • 设计理念和目标


交互艺术的设计理念和目标可以根据具体项目的不同而有所不同,比如以互动性为主:交互艺术的设计目标是与观众进行互动,让观众成为艺术作品的一部分。互动可以是双向的,也可以是多向的,观众和作品之间可以有各种形式的交流和反馈。以参与性为主:交互艺术作品的设计目的是让观众成为作品的参与者,观众不仅是作品的被动观看者,还可以通过各种方式主动参与到作品中,体验艺术的过程。以创新性为主:交互艺术通常借助科技手段来实现艺术形式的创新,例如虚拟现实、增强现实、人工智能等技术,让观众体验到新颖的艺术形式和感官体验。以实验性为主:交互艺术通常具有实验性质,设计者会尝试各种不同的技术和形式,不断探索和发掘新的艺术表现方式和可能性。以社交性为主:交互艺术作品通常可以带来社交体验,让多个观众之间产生互动和交流,增加观众之间的沟通和共同体验。以可持续性为主:交互艺术的设计也需要考虑作品的可持续性,包括对环境的影响、对观众的健康和安全等方面的考虑。同时还需要考虑作品的维护和管理,确保作品的长期运行和展示。



  • 技术实现和选择


交互艺术的技术实现有多种选择,以下是一些常见的技术实现:



  1. 传感器技术:通过感应器获取观众的运动、声音、触摸等行为,以此来激发或控制艺术作品的变化。

  2. 虚拟现实技术:使用计算机技术和虚拟现实设备(如头戴式显示器、手套式控制器等)创造虚拟空间,使观众可以沉浸在其中与作品进行交互。

  3. 增强现实技术:使用手机、平板电脑等设备,将虚拟图像叠加在现实场景中,使观众可以在真实场景中进行虚拟的交互体验。

  4. 数据可视化技术:使用数据可视化软件和技术将数据转化为图形、动画、声音等形式,让观众可以与数据进行交互并得到更深入的理解。

  5. 互动音乐技术:使用计算机技术和音乐软件,将观众的声音、运动等行为转化为音乐,并与音乐作品进行互动。

  6. 智能机器人技术:使用机器人技术和人工智能技术,创造能够与观众进行交互的智能机器人艺术作品。


除此之外,还有许多其他的技术可以被应用于交互艺术的实现,这取决于艺术家的创造力和技术能力。



  • 用户参与和反馈


用户参与和反馈在交互艺术中起着至关重要的作用,这是因为交互艺术强调观众参与、互动和沟通,与传统艺术形式相比,用户的参与和反馈更能够影响交互艺术的展现和效果。用户参与和反馈可以创造更丰富、更具有互动性的艺术体验。通过参与和反馈,用户可以主动探索和发现艺术作品中的细节,与艺术家进行更深入的互动和交流。用户参与和反馈可以增加用户对交互艺术的参与度,使观众更加融入艺术作品之中,感受到艺术作品所传达的情感和信息。用户反馈可以帮助艺术家改善艺术作品的表现,及时发现并解决问题,让作品更加完善和符合观众的期望。通过参与和反馈,用户可以更好地理解和体验艺术作品,从而对作品产生更深刻的印象和理解,提高作品的艺术价值和影响力。


交互艺术的影响和意义



  • 对艺术和文化的影响


首先,交互艺术提供了新的观看方式和体验方式,通过参与和互动,观众成为了作品的一部分,与作品发生了联系和互动,这种体验方式比传统艺术观看更加身临其境,更能够引起观众的共鸣和情感共鸣。


其次,交互艺术扩展了艺术形式和创作方式的范围,使得艺术家可以使用更多的媒介和技术手段来表现自己的创意和思想,创作出更加复杂、多样化的作品。同时,交互艺术还促进了跨学科的合作和交流,让不同领域的人们汇聚在一起,共同探索艺术的新领域和可能性。


最后,交互艺术也在一定程度上挑战了传统艺术的观念和价值体系,它更加强调观众的参与和互动,追求创意和表达的多样性和自由性,让艺术更加民主化和开放化,更加贴近生活和人们的需求。



  • 对科技和创新的影响


交互艺术与科技、创新密切相关,因为交互艺术往往需要运用先进的科技和技术手段来实现。因此,交互艺术对科技和创新的影响主要表现在以下几个方面:



  1. 推动科技进步和应用:交互艺术在探索人机交互的过程中,往往需要运用先进的科技和技术手段,例如虚拟现实、增强现实、智能算法、传感器技术等等。这些技术的研究和应用,可以推动科技的进步和应用,也可以为其他领域的技术创新提供借鉴和参考。

  2. 催生新兴产业:随着交互艺术的不断发展和普及,一些新兴产业也应运而生,例如虚拟现实、增强现实、智能穿戴等等。这些产业的发展,也为科技和创新提供了新的发展机遇。

  3. 拓展创新思维:交互艺术强调观众参与和互动,鼓励观众从不同的角度去思考和理解作品。这种互动式的艺术形式,不仅可以拓展观众的视野和想象力,也可以激发人们的创新思维,从而为科技和创新带来新的灵感和方向。

  4. 促进科技与文化的融合:交互艺术将科技和文化相结合,探索科技与文化之间的互动和融合。这种融合不仅可以为文化艺术注入新的活力和创新,也可以促进科技和文化之间的相互理解和交流,为科技和创新带来新的思路和方向。



  • 对社会和人类的影响


首先,交互艺术的出现丰富了人们的文化生活,为人们带来了全新的艺术体验。交互艺术将观众从被动的接受者转变为积极的参与者和创造者,让人们更深入地体验艺术,对个人的审美和文化素养的提高有积极的推动作用。


其次,交互艺术对科技和创新的发展也有很大的促进作用。在交互艺术的设计中,常常会运用到各种前沿的科技手段,如人工智能、虚拟现实、增强现实等,这些技术的应用不仅提高了艺术表现的多样性和创新性,也促进了科技的发展和推广。


另外,交互艺术也推动了跨学科的合作与交流。交互艺术的创作需要艺术家、设计师、工程师等多个领域的专业人才进行合作,这种跨学科的合作有助于促进不同领域之间的交流与合作,进一步推动科技和艺术的发展。


最后,交互艺术也对社会产生了深远的影响。交互艺术作为一种探索艺术与科技、人与自然等关系的艺术形式,常常会引起人们对社会和人类的思考和反思。同时,交互艺术还可以作为一种公共艺术形式,为城市文化建设和社区文化发展做出贡献。


一些优秀的交互艺术作品的介绍和分析


《雨林声音之旅》(The Rainforest):这是一个由音乐家、工程师和艺术家合作制作的多媒体艺术作品,旨在通过视听交互体验向人们展示热带雨林生态系统的美丽和脆弱。在这个作品中,观众通过穿戴智能耳机,能够听到热带雨林中各种生物的声音,并随着观众的行动而改变。这个作品既展示了交互艺术对生态保护的关注,也通过技术手段提供了一个沉浸式的交互体验。


《万花筒之舞》(Kaleidoscope Dance):这个作品由艺术家和编程人员合作创作,是一个通过跟随舞者动作变幻图形的互动舞蹈。在这个作品中,观众通过观看跳舞者的身影,看到身影在投影上变幻出不同的几何图形,并随着舞者的动作而变化。这个作品的互动性和美学效果非常出色,展示了交互艺术的创造性和能力。


《未来自然》(Future Natural):这个作品由美国纽约市的艺术家托尼·瑞戈(tony oursler)制作,展示了未来科技与自然环境的融合。这个作品是一个互动装置,观众通过操纵屏幕上的自然元素,比如云、火、风和水,来创造出自己的自然景观。这个作品展示了交互艺术的潜力,让观众在艺术作品中自由探索和创造。


《印象派的视觉音乐》(Visual Music of Impressionism):这是一个通过数字技术还原19世纪法国印象派画家的绘画作品的互动展览。这个展览展示了通过数字技术将视觉艺术与音乐相结合的能力,让观众可以通过触摸屏幕、移动手势和声音互动等方式来探索印象派绘画作品的美学和音乐性。


未来展望:交互艺术的发展和趋势


交互艺术从20世纪末期开始兴起,并在21世纪初逐渐得到了广泛的关注和发展。最初的交互艺术作品主要依赖计算机技术,随着移动设备、传感器、物联网等技术的发展,交互艺术的形式也越来越多样化和复杂化。


近年来,交互艺术已经从传统的展览空间向公共空间和虚拟空间延伸,例如城市中的互动艺术装置和游戏、虚拟现实艺术作品等。同时,交互艺术也更多地关注社会和环境问题,例如气候变化、人类生活和工作的影响等。


未来的趋势将继续突破传统的艺术形式,更多地与科技、社会、文化等领域交叉融合,例如增强现实、人工智能、机器人技术等。同时,交互艺术也将更加强调观众的参与和反馈,更加注重体验和互动的情感性和反思性。


作者:HeteroCat
链接:https://juejin.cn/post/7215084575495929915
来源:稀土掘金
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
收起阅读 »

ChatGPT正在杀死程序员,讲讲我的看法——AI春晚,Boom!

AI春晚,Boom! 这两周,简直是AI春晚,ChatGPT4、ChatGPT Plugin、Microsoft 365 copilot、Github copilotX、MidJourney V5、Adobe Firefly、NVIDIA一堆新产品... 多到...
继续阅读 »

AI春晚,Boom!


这两周,简直是AI春晚,ChatGPT4、ChatGPT Plugin、Microsoft 365 copilot、Github copilotX、MidJourney V5、Adobe Firefly、NVIDIA一堆新产品... 多到数不过来了,几乎是数不过来了,大产品发布的速度可以用小时来计算,小产品更是多如牛毛,github trends、Hacker News差不多半数都被ChatGPT相关霸榜。


可谓科技圈的“大变局”,上一次大家这么激动,还是iPhone诞生。


接下来,我来说说看我的看法和一些个人预测。


我的几点看法




  1. ChatGPT的诞生,将带来新的革命,第一次信息技术革命主要是加速了信息传递,而此次第二次信息技术革命,则是让信息传递进一步加速的同时,让信息有了自生产能力。例如:你给AI一个标题,AI可以根据过往学习经验,联想一个新的故事。又比如:你写了一段新的代码,可以让AI帮你解释,也许未来帮你写文档。AI可以根据少量的信息,进行信息生产,这是替代人类一部分能力的关键点。




  2. 我认为大语言模型的能力并未被全部释放,AI可以做的还有更多,更有创造力,只不过暂时被封印了。未来的前景空间无限,随便上升一点点都是big boom.




  3. 这只是这一种模型而已... 相信AI行业的投入的资金接下来会是爆炸式的增长。其他模型大概率很快在资金加持下,进行多轮验证。指不定再来个别的超级AI。




  4. 自然语言(提示语)编程诞生,这将是最难的一门语言,短期来看,必然是英语,掌握英语的人未来拥有更大的竞争力。但是自然语言有较大的缺陷,就是难以构建复杂结构和海量参数的提示语,而人类的需求往往是精准的,只用自然语言效率比较低。所以我预测,未来会有更加结构化的语言诞生,它将综合人类的自然语言和高级编程语言,成长为新的热门语言。




  5. 毫无疑问,随着内容创作方面的效率急速提升,大多数白领的工作将会受到极大影响,被调整优化。不进步就会被淘汰,但是也意味着会出现新的机会。




  6. AI程序员不仅正在杀死白领,还无情地杀死另外一些程序员,底层如前端程序员和测试工程师将会受到巨大影响,优化。这其实是因为,相当一部分程序员的工作其实更接近于内容创作(cv工程师),而不是严密的逻辑思考和创造,所以更容易被AI取代。不得不说,程序员的差距就像人与狗的差距一样大。




  7. 新的繁荣即将到来?毫无疑问。纺织机夺走了大部分手工纺织者的工作,但是催生了更庞大的市场,例如服装设计,人的需求促使人朝着更加高级的方向发展了。那新的工作机会呢?可能是自然语言(提示语)工程、AI训练师等等。




  8. 恭喜前端程序员,终于不用写大量页面和CSS了,暂时也许可以考虑往全栈卷了?




  9. 如果你是一个简单的内容工作者或者初级程序员,那么赶紧学吧,否则将面临失业。




  10. 如果你是中高级技术工程师,也赶紧学吧,新的机会正在到来。本来吧,互联网遇冷,就业困难,大家都不想学了,学不动了,现在好了,局势逼着你学。




  11. 好消息是,我们有墙,也可能是坏消息。




  12. 可以大概率肯定的是,就业市场应该很快会回暖,现在就等巨头公司找找方向,开启新市场。


作者:宋承亮
链接:https://juejin.cn/post/7214493929566748732
来源:稀土掘金
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
收起阅读 »

用ChatGPT提高开发效率(Andoid)

一、前言 我们问了10个问题,开发的、生活中有疑问的,ChartGPT都给了我们答案。这些答案怎么样,请往下看吧。 ChatGPT-1、写一个车牌号的正则表达式 ChatGPT-2、写一个中国大陆车牌号的正则表达式 ChatGPT-3、用kotlin写一个车...
继续阅读 »

一、前言


我们问了10个问题,开发的、生活中有疑问的,ChartGPT都给了我们答案。这些答案怎么样,请往下看吧。



  • ChatGPT-1、写一个车牌号的正则表达式

  • ChatGPT-2、写一个中国大陆车牌号的正则表达式

  • ChatGPT-3、用kotlin写一个车牌号的校验函数

  • ChatGPT-4、用Kotlin写一个String装换成金额的扩展函数

  • ChatGPT-5、用Kotlin写一个String装换成人民币的扩展函数

  • ChatGPT-6、用Kotlin写一个String转换成人民币的扩展函数

  • ChatGPT-7、用Kotlin写一个将TextView的文本内容复制到粘贴板的扩展函数

  • ChatGPT-8、美食探店怎么做?

  • ChatGPT-9、台湾卤肉饭?

  • ChatGPT-10、牛皮弃面馆(柏庐南路店)


二、ChatGPT使用初体验


ChatGPT-1、写一个车牌号的正则表达式
企业微信截图_16796251027919.png


ChatGPT-2、写一个中国大陆车牌号的正则表达式
企业微信截图_1679625500776.png
^[京津沪渝冀豫云辽黑湘皖鲁新苏浙赣鄂桂甘晋蒙陕吉闽贵粤青藏川宁琼][A-HJ-NP-Z](?!DD)[A-HJ-NP-Z0-9]{4}[A-HJ-NP-Z0-9挂学警港澳]$


ChatGPT-3、用kotlin写一个车牌号的校验函数
企业微信截图_16796251209911.png


三、ChatGPT PK 5年+年程序员


ChatGPT-4、用Kotlin写一个String装换成金额的扩展函数
企业微信截图_16796251209911.png


ChatGPT-5、用Kotlin写一个String装换成人民币的扩展函数
企业微信截图_16796251209911.png


ChatGPT-6、用Kotlin写一个String转换成人民币的扩展函数
1111.png
PK
image2023-3-24_11-2-10.png


ChatGPT-7、用Kotlin写一个将TextView的文本内容复制到粘贴板的扩展函数
image2023-3-24_11-2-10.png
PK
image2023-3-24_11-3-0.png


四、总结


ChatGPT-1、写一个车牌号的正则表达式

ChatGPT-2、写一个中国大陆车牌号的正则表达式

ChatGPT-3、用kotlin写一个车牌号的校验函数


以上问题,明确的告诉了我们答案,并且配上了讲解和使用方法。


极大的减少了我们自己写正则的错误概率,或者网上查,答案质量参差不齐的筛选验证的烦恼。


对这种重复劳动、通用的功能函数,ChatGPT很好用


ChatGPT-4、用Kotlin写一个String装换成金额的扩展函数

ChatGPT-5、用Kotlin写一个String装换成人民币的扩展函数

ChatGPT-6、用Kotlin写一个String转换成人民币的扩展函数

ChatGPT-7、用Kotlin写一个将TextView的文本内容复制到粘贴板的扩展函数


以上问题,实现了在开发过程中实际的问题,直接Copy就可以使用


请注意我的问题,用Kotlin写一个String转换成人民币的扩展函数,只要你问题问的明确,ChatGPT就会给你想要的答案


ChatGPT-4、ChatGPT-5转换写错了,写成了装换,ChatGPT理解了我的意思,并且他自我纠正了


ChatGPT-6、ChatGPT-7,ChatGPT与5年+程序员的PK,功能都实现了,实现思路基本相同。但是5+程序员写的更简洁,自由 (程序员的个人素质了,Lewis对个人要求标准较高,这就是通往大佬的之路)。


你在通往IT大佬的路上,不要轻视ChatGPT哦,我们使用的ChatGPT是通用版,训练出来的模型是面向所有用户的。


一个假设,如果使用Githut上所有的代码训练ChatGPT,训练出来的模型还会比不过5年的程序员吗?Githut+ChatGPT好像都为微软的,这个假设可能已经在实验室阶段了。


以上假设已经有了,GitHub Copilot X GitHub + GPT-4联手的产品


五、ChatGPT最后的胡说八道


ChatGPT-8、美食探店怎么做?
企业微信截图_16796255651978.png


ChatGPT-9、台湾卤肉饭?
企业微信截图_16796256304717.png


ChatGPT-10、牛皮弃面馆(柏庐南路店)
企业微信截图_1679625678718.png


ChatGPT-8、美食探店怎么做?

ChatGPT-9、台湾卤肉饭?

ChatGPT-10、牛皮弃面馆(柏庐南路店)


以上问题,初一看ChatGPT回答的很专业,以下详细说一下


ChatGPT-8、ChatGPT-9,很多人都有疑问的问题,网上资料很多,回答的很专业,也很有条理,挺好。作为一个技术就不都说了,可以看看这个「打不过,就加入」,我和ChatGPT的故事


ChatGPT-10,昆山一家小店,没有名气,主打台湾牛肉面和台湾小吃,ChatGPT就开始胡说八道了,但是显得很专业,他谈的模板就是按照逻辑去介绍一家店。如果你问他一家有名的店或者连锁店(例如:海底捞),他会回答的应该很专业。


其实还有很多疑问的,移动开发未来前景怎么样?ETH今天会不会大跌,短线做空可以吗?,但是毕竟今天周五了,让自己过一个愉快的周末吧^_^。


作者:佳应科技
链接:https://juejin.cn/post/7215020908238209083
来源:稀土掘金
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
收起阅读 »

里程碑!ChatGPT插件影响几何?

上周三OpenAI推出了GPT-4,引起了全球轰动,仅仅过去一周多时间,OpenAI又宣布推出插件功能。如果说ChatGPT是AI的“iPhone时刻”,那么插件就是ChatGPT的“App Store”。超强的开发迭代能力,层出不穷的王炸级新产品,让我们不得...
继续阅读 »

上周三OpenAI推出了GPT-4,引起了全球轰动,仅仅过去一周多时间,OpenAI又宣布推出插件功能。如果说ChatGPT是AI的“iPhone时刻”,那么插件就是ChatGPT的“App Store”。超强的开发迭代能力,层出不穷的王炸级新产品,让我们不得不对OpenAI由衷赞叹。


插件发布


3月24日,OpenAI宣布ChatGPT能够支持第三方插件接入,同时为ChatGPT发布了多个插件,它们将帮助ChatGPT联网实时检索信息、运行计算或使用第三方服务。目前装上插件后,用户可以用 ChatGPT 执行以下操作:




  • 检索实时信息:例如体育比赛比分、股价、最新消息等;




  • 检索知识库信息:例如公司文件、个人笔记等;




  • 代表用户执行操作:例如,订机票、订餐等。




由此可以看出,ChatGPT不再是一个单一的知识问答机器人,它将完全走进我们的日常工作和生活,成为全天候平台生态系统。


image.png


根据OpenAI官方发布信息,ChatGPT的第一批第三方插件包含Expedia、FiscalNote、Instacart、KAYAK、Klarna、Milo、OpenTable、Shopify、Slack、Speak、Wolfram、Zapier等11种。例如Open Table插件允许用户搜索可预订的餐厅,Wolfram插件能够提高计算能力,Instacart插件允许ChatGPT在本地商店购物,Zapier可与谷歌Gmail等应用程序连接,适用于办公场景。除了第三方插件,OpenAI同时推出了自己的两款插件——网络浏览器(web browser)和代码解释器(code interpreter)。


网络浏览器


网络浏览器(web browser)是此次最受大家关注的插件,该插件使用微软必应搜索API从网络上检索内容,同时显示它在概括答案时所访问的网站,并在ChatGPT的回应中引用其来源。此前的ChatGPT包括GTP-4训练数据库的信息内容仅限于2021年9月之前的数据,现在通过该插件ChatGPT可以获得网络上最新的数据,极大提高问题回答的时效性。


例如下面的问题中,ChatGPT可以给出2023年的奥斯卡颁奖名单。


image.png


ChatGPT以往是被动接收数据进行推理,开发人员给它投喂大量历史数据,基于这些数据进行推理,从而给出答案。因此,ChatGPT能够获得巨大成功的原因是其出色的推理能力,人总是处于学习知识的过程,要求的是知识回答准确度,对于新鲜度反而要求不高,出色的推理能力有效保证了知识回答的准确性和条理性。相信掘友们没少让ChatGPT写诗,写小说,写代码,这些出色创作并不需要从网络上去获取最新的内容。


但随着大家对ChatGPT的越来越熟悉,使用需求也越来越多,从知识问答扩展到日常生活、工作和出行,个人事务、财务和交际,这就需要当前最新的回答,需要ChatGPT从最新网络数据去检索、分析和推理,也就是从被动接收数据变为主动获取数据,ChatGPT具备了眼睛和耳朵,能够去听去看,去与当前的网络世界进行同步。


代码解释器


代码解释器则能够执行数学问题、数据分析、可视化和文件格式转换等任务,使ChatGPT能够使用Python并在沙盒环境中处理上传和下载任务。简单来说,代码解释器能够为你复杂的问题直接提供代码,省去你大部分的编码工作,也能够阅读代码,修改代码bug。


根据官方的例子,当问到:一块砖的重量是这块砖自身 30% 的重量与 5 个 GPU 的重量之和,已知每吨重量包含了 100 块砖和 200 个 GPU,那么一块砖的重量是多少?


image.png


经过代码解释器后,给出了代码和答案


image.png


这里我们可以看到,回答问题不再简单的文字描述,而是升级到源码描述,说实话惊叹之余感觉到了一丝丝的危机感,假以时日,随着ChatGPT能力不断提升,如果能够完成系统级编程,程序员门槛会不断降低,对于大多数程序员都将形成冲击。


平台生态


通过上面对这次插件的分析可以看到,ChatGPT不再满足于单纯作为一个聊天机器人,插件功能就是ChatGPT的应用商店。在3月34日之前,我们认为的合作关系是ChatGPT接入到其他APP,为其他APP赋能,属于从属低位。在3月34日之后,我们发现所有APP将纳入ChatGPT,形成ChatGPT生态系统,ChatGPT去指挥其他APP工作,属于主导地位。


ChatGPT试图通过插件功能建立生态系统。在这个生态系统中,开发人员可以创建并发布他们自己的插件,借助ChatGPT获取用户和收益。目前手机厂商的应用商店也是这样,第三方应用经过应用商店安装,消费者发生购买行为后,应用商店可以进行抽成获取利润。三个月前,我们担心ChatGPT训练成本非常高,但没有良好的商业化模式,发展困难。现在插件功能出来后,没有一个人会再去担心ChatGPT商业能力,反而是担心自己能不能搭上人工智能的快车,自己会不会被时代所淘汰。


微软魄力


说完OpenAI的重大突破,回过头来,不得不佩服微软的魄力和决心。在必应接入GTP后,必应搜索引擎的访问量增长15%,谷歌降低了1%,一片形势大好,接入GTP的产品就是New Bing,因此这次插件功能的发布最尴尬的反而是New Bing。拥有插件功能的ChatGPT明显比搜索引擎属性加身的New Bing更有发展前景,对于市场前景来说,New Bing基本等同于完整版的必应,微软推陈出新,斩人先斩己。


这与腾讯有点相似,在QQ还是即时通信老大的情况下,坚决推出了微信,时至今日,微信建立起的生态帝国让腾讯无往不利。如果说插件功能即将构建的生态系统,未来将匹敌甚至超过App Store和谷歌搜索的商业价值,已经不会让人觉得是异想天开了。


总结


从GTP3.5到GTP4,从微软Office Copilot到ChatGPT插件,AI技术的演进和应用正以超乎想象的速度袭来,在过去的这几个月,尤其这两周,我们听惯了重磅、史诗、王炸等词,面对日新月异的技术发展,对于个人来说,我们需要选择拥抱新的领域,新的技术,通过了解来调整自己的工作方式和学习目标;对于企业来说,需要熟悉AI技术的现状和未来预期,积极评估面临的冲击和机遇。


作者:柒号华仔
来源:juejin.cn/post/7214489453399474232
收起阅读 »

用ChatGPT提高开发效率(Andoid)

一、前言 我们问了10个问题,开发的、生活中有疑问的,ChartGPT都给了我们答案。这些答案怎么样,请往下看吧。 ChatGPT-1、写一个车牌号的正则表达式 ChatGPT-2、写一个中国大陆车牌号的正则表达式 ChatGPT-3、用kotlin写一个车...
继续阅读 »

一、前言


我们问了10个问题,开发的、生活中有疑问的,ChartGPT都给了我们答案。这些答案怎么样,请往下看吧。



  • ChatGPT-1、写一个车牌号的正则表达式

  • ChatGPT-2、写一个中国大陆车牌号的正则表达式

  • ChatGPT-3、用kotlin写一个车牌号的校验函数

  • ChatGPT-4、用Kotlin写一个String装换成金额的扩展函数

  • ChatGPT-5、用Kotlin写一个String装换成人民币的扩展函数

  • ChatGPT-6、用Kotlin写一个String转换成人民币的扩展函数

  • ChatGPT-7、用Kotlin写一个将TextView的文本内容复制到粘贴板的扩展函数

  • ChatGPT-8、美食探店怎么做?

  • ChatGPT-9、台湾卤肉饭?

  • ChatGPT-10、牛皮弃面馆(柏庐南路店)


二、ChatGPT使用初体验


ChatGPT-1、写一个车牌号的正则表达式
企业微信截图_16796251027919.png


ChatGPT-2、写一个中国大陆车牌号的正则表达式
企业微信截图_1679625500776.png
^[京津沪渝冀豫云辽黑湘皖鲁新苏浙赣鄂桂甘晋蒙陕吉闽贵粤青藏川宁琼][A-HJ-NP-Z](?!DD)[A-HJ-NP-Z0-9]{4}[A-HJ-NP-Z0-9挂学警港澳]$


ChatGPT-3、用kotlin写一个车牌号的校验函数
企业微信截图_16796251209911.png


三、ChatGPT PK 5年+年程序员


ChatGPT-4、用Kotlin写一个String装换成金额的扩展函数
企业微信截图_16796251209911.png


ChatGPT-5、用Kotlin写一个String装换成人民币的扩展函数
企业微信截图_16796251209911.png


ChatGPT-6、用Kotlin写一个String转换成人民币的扩展函数
1111.png
PK
image2023-3-24_11-2-10.png


ChatGPT-7、用Kotlin写一个将TextView的文本内容复制到粘贴板的扩展函数
image2023-3-24_11-2-10.png
PK
image2023-3-24_11-3-0.png


四、总结


ChatGPT-1、写一个车牌号的正则表达式

ChatGPT-2、写一个中国大陆车牌号的正则表达式

ChatGPT-3、用kotlin写一个车牌号的校验函数


以上问题,明确的告诉了我们答案,并且配上了讲解和使用方法。


极大的减少了我们自己写正则的错误概率,或者网上查,答案质量参差不齐的筛选验证的烦恼。


对这种重复劳动、通用的功能函数,ChatGPT很好用


ChatGPT-4、用Kotlin写一个String装换成金额的扩展函数

ChatGPT-5、用Kotlin写一个String装换成人民币的扩展函数

ChatGPT-6、用Kotlin写一个String转换成人民币的扩展函数

ChatGPT-7、用Kotlin写一个将TextView的文本内容复制到粘贴板的扩展函数


以上问题,实现了在开发过程中实际的问题,直接Copy就可以使用


请注意我的问题,用Kotlin写一个String转换成人民币的扩展函数,只要你问题问的明确,ChatGPT就会给你想要的答案


ChatGPT-4、ChatGPT-5转换写错了,写成了装换,ChatGPT理解了我的意思,并且他自我纠正了


ChatGPT-6、ChatGPT-7,ChatGPT与5年+程序员的PK,功能都实现了,实现思路基本相同。但是5+程序员写的更简洁,自由 (程序员的个人素质了,Lewis对个人要求标准较高,这就是通往大佬的之路)。


你在通往IT大佬的路上,不要轻视ChatGPT哦,我们使用的ChatGPT是通用版,训练出来的模型是面向所有用户的。


一个假设,如果使用Githut上所有的代码训练ChatGPT,训练出来的模型还会比不过5年的程序员吗?Githut+ChatGPT好像都为微软的,这个假设可能已经在实验室阶段了。


以上假设已经有了,GitHub Copilot X GitHub + GPT-4联手的产品


五、ChatGPT最后的胡说八道


ChatGPT-8、美食探店怎么做?
企业微信截图_16796255651978.png


ChatGPT-9、台湾卤肉饭?
企业微信截图_16796256304717.png


ChatGPT-10、牛皮弃面馆(柏庐南路店)
企业微信截图_1679625678718.png


ChatGPT-8、美食探店怎么做?

ChatGPT-9、台湾卤肉饭?

ChatGPT-10、牛皮弃面馆(柏庐南路店)


以上问题,初一看ChatGPT回答的很专业,以下详细说一下


ChatGPT-8、ChatGPT-9,很多人都有疑问的问题,网上资料很多,回答的很专业,也很有条理,挺好。作为一个技术就不都说了,可以看看这个「打不过,就加入」,我和ChatGPT的故事


ChatGPT-10,昆山一家小店,没有名气,主打台湾牛肉面和台湾小吃,ChatGPT就开始胡说八道了,但是显得很专业,他谈的模板就是按照逻辑去介绍一家店。如果你问他一家有名的店或者连锁店(例如:海底捞),他会回答的应该很专业。


其实还有很多疑问的,移动开发未来前景怎么样?ETH今天会不会大跌,短线做空可以吗?,但是毕竟今天周五了,让自己过一个愉快的周末吧^_^。


六、延伸阅读


mp.weixin.qq.com/s/PyH2SzFQ9…


juejin.cn/post/721177…


juejin.cn/post/719767…


mp.weixin.qq.com/s/prXyAUf_8…


mp.weixin.qq.com/s/Y1LUxcInd…


mp.weixin.qq.com/s/a3xZZLRgD…


作者:佳应科技
来源:juejin.cn/post/7215020908238209083
收起阅读 »

扒了一千多条关于文心一言的评论,我发现这届网友真的不好糊弄…

前两天,百度紧随GPT-4发布了自己的语言模型文心一言。 讲道理,对于国内能够发布这样一个敢于对标CHAT GPT的高质量语言模型,大家应该更多感受到的是赛博朋克与现实生活贴近的真实感,对这个模型应该有着更多的鼓励或赞美。 可不知是因为整个发布会搞的过于像没有...
继续阅读 »

前两天,百度紧随GPT-4发布了自己的语言模型文心一言。


讲道理,对于国内能够发布这样一个敢于对标CHAT GPT的高质量语言模型,大家应该更多感受到的是赛博朋克与现实生活贴近的真实感,对这个模型应该有着更多的鼓励或赞美。


可不知是因为整个发布会搞的过于像没有好好准备的学生毕业答辩PPT,还是它的实际表现并没有那么如人意,大家貌似对文心一言并不那么买账。


于是我决定看一下知乎大神们对文心一言的评价,哪想到随便打开一个问题,居然有600多条回答…



要是我这一条一条翻完所有回答, 估计就得拿出一天来全职摸鱼了 ,那么有没有什么办法能够最快的分析出对待这个问题大家的综合评价呢?


那么今天就让我纱布擦屁股,给大家露一小手,写一个爬虫扒下来所有的回答,再对结果进行一下分析。


WebMagic


正式开始前,咱们得先搞定工具。虽然python写起爬虫来有天然的框架优势,不过鉴于大家都是搞java的,那么我们今天就用java框架来实现一个爬虫。


咱们要使用的工具 WebMagic,就是一款简单灵活的java爬虫框架,总体架构由下面这几部分构成:




  • Downloader:负责从互联网上下载页面,以便后续处理。WebMagic默认使用了Apache HttpClient作为下载工具。

  • PageProcessor:负责解析页面,抽取有用信息,以及发现新的链接。WebMagic使用Jsoup作为HTML解析工具,并基于其开发了解析XPath的工具Xsoup。

  • Scheduler:负责管理待抓取的URL,以及一些去重的工作。WebMagic默认提供了JDK的内存队列来管理URL,并用集合来进行去重。也支持使用Redis进行分布式管理。

  • Pipeline:负责抽取结果的处理,包括计算、持久化到文件、数据库等。WebMagic默认提供了输出到控制台和保存到文件两种结果处理方案。


在4个主要组件中,除了PageProcessor之外,其他3个组件基本都可以复用。而我们实际爬虫中的重点,就是要针对不同网页进行页面元素的分析,进而定制化地开发不同的PageProcessor


下面我们开始准备实战,先引入webmagiccoreextension两个依赖,最新0.8.0版本搞里头:


<dependency>
<groupId>us.codecraftgroupId>
<artifactId>webmagic-coreartifactId>
<version>0.8.0version>
dependency>
<dependency>
<groupId>us.codecraftgroupId>
<artifactId>webmagic-extensionartifactId>
<version>0.8.0version>
dependency>

PageProcessor 与 xpath


在正式开始抓取页面前,我们先看看知乎上一个问题的页面是怎么构成的,还是以上面图中那个问题为例,原问题的地址在这里:



如何看待百度发布的文心一言?



我们先做个简单的测试,来获取这个问题的标题,以及对这个问题的描述


通过浏览器的审查元素,可以看到标题是一个h1的标题元素,并且它的class属性是QuestionHeader-title,而问题的描述部分在一个div中,它的class中包含了QuestionRichText



简单分析完了,按照前面说的,我们要对这个页面定制一个PageProcessor组件抽取信息,直接上代码。


新建一个类实现PageProcessor接口,并实现接口中的process()这个方法即可。


public class WenxinProcessor implements PageProcessor {
private Site site = Site.me()
.setRetryTimes(3).setSleepTime(1000);

@Override
public void process(Page page) {
String title = page.getHtml()
.xpath("//h1[@class='QuestionHeader-title']/text()").toString();
String question= page.getHtml()
.xpath("//div[@class='QuestionRichText']//tidyText()").toString();

System.out.println(title);
System.out.println(question);
}

public Site getSite() {
return site;
}

public static void main(String[] args) {
Spider.create(new WenxinProcessor())
.addUrl("https://www.zhihu.com/question/589929380")
.thread(2)
.run();
}
}

查看运行结果:



可以看到,在代码中通过xpath()这样一个方法,成功拿到了我们要取的两个元素。其实说白了,这个xpath也不是爬虫框架中才有的新玩意,而是一种XML路径语言(XML Path Language),是一种用来确定XML文档中某部分位置的语言。它基于XML的树状结构,提供在数据结构树中找寻节点的能力。


常用的路径表达式包括:


表达式描述
nodename选取此节点的所有子节点。
/从根节点选取。
//从匹配选择的当前节点选择文档中的节点,而不考虑它们的位置。
.选取当前节点。
..选取当前节点的父节点。
@选取属性。

在上面的代码中,//h1[@class='QuestionHeader-title']就表示选取一个类型为h1的节点,并且它有一个class为QuestionHeader-title的属性。


至于后面的text()tidyText()方法,则是用于提取元素中的文本,这些函数不是标准xpath中的,而是webMagic中特有的新方法,这些函数的使用可以参考文档:



webmagic.io/docs/zh/pos…



看到这,你可能还有个问题,这里对于问题的描述部分没有显示完全,你需要在页面上点一下这个显示全部它才会显示详细的信息。



没关系,这里先留个坑,这个问题放在后面解决。


获取提问的答案


我们完善一下上面的代码,尝试获取问题的解答。按照老套路,还是先分析页面元素再用xpath写表达式获取。修改process方法:


@Override
public void process(Page page) {
String contentPath= "div[@class='QuestionAnswers-answers']"+
"//div[@class='RichContent RichContent--unescapable']" +
"//div[@class='RichContent-inner']"+
"/tidyText()";
List answerList = page.getHtml().xpath(contentPath).all();
for (int i = 0; i < answerList.size(); i++) {
System.out.println("第"+(i+1)+"条回答:");
System.out.println(answerList.get(i)+"\n=======");
}
}

在上面的代码中,使用了xpath获取页面中具有相同属性的元素,并将它们存入了List列表中。看一下运行结果:



纳尼?这个问题明明有着689条的回答,为什么我们只爬到了两条答案?


如果你经常用知乎来学习摸鱼的话,其实就会知道对于这种有大量回答的问题,页面刚开始只会默认显示很少的几条的消息,随着你不断的下拉页面才会把新的回答显示出来。


那么如果我想拿到所有的评论应该怎么做呢?这时候就要引出webMagic中另一个神奇的组件Selenium了。


Selenium


简单来说,selenium是一个用于Web应用程序测试的工具,selenium测试可以直接运行在浏览器中,就像真正的用户在操作一样,并且目前主流的大牌浏览器一般都支持这项技术。


所以在爬虫中,我们可以通过编写模仿用户操作的selenium脚本,模拟进行一部分用互操作,比如点击事件或屏幕滚动等等。


WebMagic-Selenium需要依赖于WebDriver,所以我们先进行本地WebDriver的安装操作。


安装WebDriver


查看自己电脑上Chrome版本,可以点击设置->关于chrome查看,也可以直接在地址栏输入chrome://settings/help



可以看到版本号,然后需要下载对应版本的WebDriver,下载地址:



chromedriver.storage.googleapis.com/index.html



打开后,可以看到各个版本,选择与本地浏览器最接近的版本:



点击进入后,根据我们的系统选择对应版本下载即可。



下载完成后,解压到本地目录中,之后在使用selenium模块中会使用到。这个文件建议放在chrome的安装目录下,否则之后在代码中可能会报一个WebDriverException: unknown error: cannot find Chrome binary找不到chrome文件的错误。


修改Selenium源码


webMagic中已经封装了selenium模块的代码,但官方版本的代码有些地方需要修改,我们下载源码后要自己简单改动一下然后重新编译。我这下载了0.8.1-SNAPSHOT版本的代码,官方git地址:



github.com/code4craft/…



修改配置文件地址,在WebDriverPoolselenium配置文件路径写死了,需要改变配置路径:


// 修改前
// private static final String DEFAULT_CONFIG_FILE = "/data/webmagic/webmagic-selenium/config.ini";
// 修改后
private static final String DEFAULT_CONFIG_FILE = "selenium.properties";

resources目录下添加配置文件selenium.properties


# What WebDriver to use for the tests
driver=chrome
# PhantomJS specific config (change according to your installation)
chrome_driver_loglevel=DEBUG

js模拟页面操作


修改SeleniumDownloaderdownload()方法,在代码中的这个位置,作者很贴心的给我们留了一行注释:



意思就是,你可以在这添加鼠标事件或者干点别的什么东西了。我们在这添加页面向下滚动这一模拟事件,每休眠2s就向下滚动一下页面,一共下拉20次:


//模拟下拉,刷新页面
for (int i=0; i < 20; i++){
System.out.println("休眠2s");
try {
//滚动到最底部
((JavascriptExecutor)webDriver)
.executeScript("window.scrollTo(0,document.body.scrollHeight)");
//休眠,等待加载页面
Thread.sleep(2000);
//往回滚一点,否则不加载
((JavascriptExecutor)webDriver)
.executeScript("window.scrollBy(0,-300)");
} catch (InterruptedException e) {
e.printStackTrace();
}
}

修改完成后本地打个包,注意还要修改一下版本号,改成和发行版的不同即可,我这里改成了0.8.1.1-SNAPSHOT


mvn clean install

调用


回到之前的爬虫项目,引入我们自己打好的包:


<dependency>
<groupId>us.codecraftgroupId>
<artifactId>webmagic-seleniumartifactId>
<version>0.8.1.1-SNAPSHOTversion>
dependency>

修改之前的主程序启动时的代码,添加Downloader组件,SeleniumDownloader构造方法的参数中传入我们下好的chrome的webDriver的可执行文件的地址:


public static void main(String[] args) {
Spider.create(new WenxinProcessor())
.addUrl("https://www.zhihu.com/question/589929380")
.thread(2)
.setDownloader(new SeleniumDownloader("D:\\Program Files\\Google\\Chrome\\Application\\chromedriver.exe")
.setSleepTime(1000))
.run();
}

进行测试,可以看到在拉动了40秒窗口后,获取到的答案条数是100条:



通过适当地添加下拉页面的循环的次数,我们就能够获取到当前问题下的全部回答了。


另外,在启动爬虫后我们会看到webDriver弹出了一个chrome的窗口,在这个窗口中有一个提示:Chrome正受到自动测试软件的控制,并且可以看到页面不断的自动下拉情况:



如果不想要这个弹窗的话,可以修改selenium模块的代码进行隐藏。修改WebDriverPoolconfigure()方法,找到这段代码:


if (driver.equals(DRIVER_CHROME)) {
mDriver = new ChromeDriver(sCaps);
}

添加一个隐藏显示的选项,并且在修改完成后,重新打包一下。


if (driver.equals(DRIVER_CHROME)) {
ChromeOptions options=new ChromeOptions();
options.setHeadless(true);
mDriver = new ChromeDriver(options);
}

获取问题详细描述


不知道大家还记不记得在前面还留了一个坑,我们现在获取到的对问题的描述是不全的,需要点一下这个按钮才能显示完全。



同样,这个问题也可以用selenium来解决,在我们下拉页面前,加上这么一个模拟点击事件,就可以获得对问题的详细描述了:


((JavascriptExecutor)webDriver)
.executeScript("document.getElementsByClassName('Button QuestionRichText-more')[0].click()");

看一下执行结果,已经可以拿到完整内容了:



Pipeline


到这里,虽然要爬的数据获取到了,但是要进行分析的话,还需要进行持久化操作。在前面的webMagic的架构图中,介绍过Pipeline组件主要负责结果的处理,所以我们再优化一下代码,添加一个Pipeline负责数据的持久化。


由于数据量也不是非常大,这里我选择了直接存入ElasticSearch中,同时也方便我们进行后续的分析操作,ES组件我使用的是esclientrhl,为了方便我还是把项目整个扔到了 spring里面。


定制一个Pipeline也很简单,实现Pipeline接口并实现里面的process()接口就可以了,通过构造方法传入ES持久化层组件:


@Slf4j
@AllArgsConstructor
public class WenxinPipeline implements Pipeline {
private final ZhihuRepository zhihuRepository;

@Override
public void process(ResultItems resultItems, Task task) {
Map map = resultItems.getAll();
String title = map.get("title").toString();
String question = map.get("question").toString();
List answer = (List) map.get("answer");

ZhihuEntity zhihuEntity;
for (String an : answer) {
zhihuEntity = new ZhihuEntity();
zhihuEntity.setTitle(title);
zhihuEntity.setQuestion(question);
zhihuEntity.setAnswer(an);
try {
zhihuRepository.save(zhihuEntity);
} catch (Exception e) {
e.printStackTrace();
}
}
}
}

把selenium向下拉取页面的次数改成200后,通过接口启动程序:


@GetMapping("wenxin")
public void wenxin() {
new Thread(() -> {
Request request = new Request("https://www.zhihu.com/question/589929380");
WenxinProcessor4 wenxinProcessor = new WenxinProcessor4();
Spider.create(wenxinProcessor)
.addRequest(request)
.addPipeline(new WenxinPipeline(zhihuRepository))
.setDownloader(new SeleniumDownloader("D:\\Program Files\\Google\\Chrome\\Application\\chromedriver.exe")
.setSleepTime(1000))
.run();
}).start();
}

运行完成后,查询一下es中的数据,可以看到,实际爬取到了673条回答。



另外,我们可以在一个爬虫程序中传入多个页面地址,只要页面元素具有相同的规则,那么它们就能用相同的爬虫逻辑处理,在下面的代码中,我们一次性传入多个页面:


Spider.create(new WenxinProcessor4())
.addUrl(new String[]{"https://www.zhihu.com/question/589941496",
"https://www.zhihu.com/question/589904230","https://www.zhihu.com/question/589938328"})
.addPipeline(new WenxinPipeline(zhihuRepository))
.setDownloader(new SeleniumDownloader("D:\\Program Files\\Google\\Chrome\\Application\\chromedriver.exe")
.setSleepTime(1000))
.run();

一顿忙活下来,最终扒下来1300多条数据。



分析


数据落到了ES里后,那我们就可以根据关键字进行分析了,我们先选择10个负面方向的词语进行查询,可以看到查到了403条数据,将近占到了总量的三分之一。



再从各种回答中选择10个正向词语查询,结果大概只有负面方向的一半左右:



不得不说,这届网友真的是很严厉…


Proxy代理


说到爬虫,其实还有一个绕不过去的东西,那就是代理。


像咱们这样的小打小闹,爬个百八十条数据虽然没啥问题,但是如果要去爬取大量数据或是用于商业,还是建议使用一下代理,一方面能够隐藏我们的IP地址起到保护自己的作用,另一方面动态IP也能有效的应对一些反爬策略。


个人在使用中,比较推荐的是隧道代理。简单的来说,如果你购买了IP服务的话,用普通代理方式的话需要你去手动请求接口获取IP地址,再到代码中动态修改。而使用隧道代理的话,就不需要自己提取代理IP了,每条隧道自动提取并使用代理IP转发用户请求,这样我们就可以专注于业务了。


虽然网上也有免费的代理能够能用,但要不然就是失效的太快,要不就是很容易被网站加入黑名单,所以如果追求性能的话还是买个专业点的代理比较好,虽然可能价格不那么便宜就是了。


题外话


看了一大顿下来,从大家略显犀利的言辞来看,大家总体上对文心一言还是不那么满意的。毕竟,在有着CHAT-GPT这么一个优秀的产品做背景板的前提下,这届网友可能没有那么好糊弄。


但是话又说回来,丑媳妇总得见公婆不是?提早暴露缺陷,也有利于国内的这些大厂,看清和一流AI产品之间的真实差距,知难而进,迎头赶上。


那么,这次的分享就到这里,我是Hydra,我们下篇再见。



文中代码已经传到我的git上啦,github.com/trunks2008/… ,欢迎大家来个star鼓励一下~




参考资料:


webmagic.io/docs/zh/pos…


blog.csdn.net/panchang199…





作者:码农参上
来源:juejin.cn/post/7213384511890800696
收起阅读 »

百度文心大模型不好用,可能是你打开方式不正确

大众向科普文章,谁都能看懂。 群友AI作画失败了 今天百度文心一言大模型发布会,我看到摸鱼群里 文心模型被群嘲了 。 大图慎点,确实有点吓人。 群里大家用的都是这个:基于ERNIE-ViLG的文心一格 然后大家都在说百度这个好垃圾,还是国外的模型好,还放...
继续阅读 »

大众向科普文章,谁都能看懂。




群友AI作画失败了


今天百度文心一言大模型发布会,我看到摸鱼群里 文心模型被群嘲了


image.png


大图慎点,确实有点吓人。


image.png


群里大家用的都是这个:基于ERNIE-ViLG的文心一格


然后大家都在说百度这个好垃圾,还是国外的模型好,还放了一下国外模型生成的妹子:


image.png


其实可能不是模型垃圾,是没找到正确的打开方式


我生成的


我生成的是下图这样的,我觉得不阴间,并且 还挺好看的


WeChat Screenshot_20230316202725.png


WeChat Screenshot_20230316202735.png


WeChat Screenshot_20230316202744.png


先不要急着说为什么你不生成真人,拿二次元出来算什么。


为什么拿二次元图作对比,我后边会解释。


使用默认风格,虽说没多可爱,但是也没那么阴间吧……


image.png


1.png


国外模型真就比文心好?


先来通俗地说两个概念:


模型


给我们生成图像的就是模型,我们给模型输入文字,模型给我们生成图片。


模型只是一堆代码写好的,像一个什么也不会的小朋友,我们需要去模型怎么生成东西。




  • 如果我们给模型一堆美少女,模型就能画出来一堆美少女,画不出男的。




  • 如果我们给模型一堆风景,那模型就能画风景,画不出来人。




检查点


你训练好的模型,学到了对应的知识,我们把这个知识称为cheakpoint,也就是检查点


比如一个小孩子不会说话:




  • 你教他英语,他以后就会说英语,那我们可以认为这个孩子的checkpoint是英语。




  • 你教他汉语,他以后就是说汉语的,那我们可以说这个孩子的checkpoint是汉语。




checkpoint在这里代指我们教给他的东西。


对比


国外现在我们接触到的是基于Stable Diffusion的。


百度的文心一格是基于ERNIE-VilG的。


为什么国外模型效果好?


国外模型效果好,是因为国外发展早,生态好,因为国外模型的cheakpoint多啊。你使用不同的Checkpoint就能生成不同类型的图片了。


下图是国外社区中Stable Diffusion的Checkpoint的冰山一角:


image.png


那百度呢?百度现在展示的是自己训练的checkpoint,怎么可能和人家那么多比啊。


俗话说双拳难敌四手,俗话说三个臭皮匠顶个诸葛亮……所以你拿人家专门微调好的checkpoint和百度去比,就相当于让一个母语是英语的人一个学了几天英语的中国人比英语水平。


当然你让国外模型的一个Checkpoint去生成它不擅长的东西,它出来的结果也很阴间。


效果对比


先说画妹子


prompt: ((masterpiece,best quality)),1girl, long hair, black hair, long black dress, pigtails, outdoor, red bows, loafer


文本提示: 女,黑头发,双马尾,黑裙子,学生,小皮鞋,黑眼睛,长裙,细节,高清,学生


国外


先展示一下我用国外模型画的二次元人物。这三个checkpoint都是专门生成二次元人物的。


CheakPoint File:meinamix_meinaV8



CheakPoint File:mixProV3_v3



CheakPoint File:pastelMixStylizedAnime_pastelMixPrunedFP16



再来看一下百度


我感觉百度的生成效果已经蛮好的了,毕竟上边三个模型,人家是在专门数据集上训练好的专门用于画二次元妹子的checkpoint,百度作为一个比较通用的模型,能做到这样真的OK了。


WeChat Screenshot_20230316202712.png


不是我尬吹,你直接用Stable Diffusion的原始模型,效果还不如文心一格呢……不信你看:


image.png


所以百度真的不拉胯的……


再来看一下风景


文本提示:雪山,河流,麋鹿,森林,风景,写实,照片,细节,高清


prompt:((masterpiece,best quality)),a high-quality, detailed, and professional image,snowy mountains, rivers, elk, deer, reindeer, forests, scenery,realistic,photos,details,high-definition



因为识别不出elk 麋鹿,所以我还多加了几个buff:鹿deer,驯鹿reindeer



我让一个国外二次元模型画


我的麋鹿呢?那是什么牛马?


WeChat Image_20230316192042.png


文心一格基础模型生成好歹有个麋鹿样子的,至少称得上差强人意:


image.png


但是直接使用Stable Diffusion当前最高版本的基础模型,效果真的没那么牛。


你看到的优秀照片都是选到了很厉害的checkpoint生成出来的成功样例罢了,幸存者偏差。


image.png


然后我换了几个CheckPoint:


checkpoint1:根本找不到麋鹿,训练时候应该就没告诉它麋鹿怎么画。


image.png


checkpoint2:有麋鹿了,还有两只,不过一只没有头。


image.png


checkpoint3:终于有麋鹿了,虽然也是不尽人意,但是这个checkpoint本来画风就比较奇幻,所以我觉得这个麋鹿还OK的。


image.png


那我怎么生成好看的图?


你可能还想说:你是狗托吧,为啥模型在你手里输出的就是正常图片,在我手里就不正常?


看一下群友的:


image.png


看一下我的:


WeChat Screenshot_20230316202838.png


我的老婆是一位身材窈窕的美女可不可以改成老婆,身材好,漂亮呢?然后顺带加上高清,细节修饰词。



高清,细节不加也行的,文心一格画质还挺好,加上这俩纯属我使用stable diffusion后遗症



功能给你了,你好好用啊!好好写写文字提示(prompt),好好选风格,生成出来的东西绝对不会阴间的。


如果你觉得没有说服力,那我拿国外模型给你展示一下:


同一个cheakpoint出来效果完全不同的两个图,而他们的区别仅在于我用的prompt不一样


在第二个图中我在文本提示中写了高画质高质量等词语。


image.png


image.png


这就好比:


你:安安你快夸我。


我:6


你:安安你快夸我,字多一点。


我:牛逼


你:安安你快夸我,字多一点,再多点。


我:牛哇牛哇


你:安安你快夸我,字多一点,再多点,最好能像动漫里软萌的妹子那样。


我:哇,欧尼酱好棒呀!今天也有好好工作呢!


文本提示越精准,模型生成图片的质量就越好。所以想要正常图片你就好好写文本提示。


当然还有其他因素,比如采样步数、负提示等等,但是百度这里没设置,也没法对比,就不说了。




为什么你不用真人模型举例子


因为我还没摸索到怎么生成好看的真人。


比如我造周淑怡:


image.png


有点像,但是也一般,看起来比较假。


但是你们看看人家造的周姐:


高清,还很像! 是模型不行吗?不是的,别人能造出来就证明不是模型的问题,是我的问题,是我还没摸索到怎么生成好看的周姐


image.png


因为我造真人也不好看,我要是拿真人照片举例子,就会显得国外模型也很拉胯,所以我选二次元图举例子。


不信你看我拿外国模型生成的双马尾妹子,也是有点恐怖……


image.png




为什么要写这个文章?


国内本来就不如国外生态好,其实模型本身效果还OK了,但是一些用户打开方式不正确,导致模型被群嘲。


其实没掌握使用技巧的话,试用国外模型也不见得会有多好的结果。


文心大模型也好,还是别的模型也好,背后是工作人员的呕心沥血。文心确实不够完美,但是也不能因为错误的使用方法或怎么一味地去否认它。


刷朋友圈看到一个评论,我感觉特别好:


image.png



“见惯了大场面的Robin今天似乎有些紧张。但不得不说,文心一言或许确实不够完美,但能够在这种环境下把他推出来,值得一些掌声了。”



作为最底层的NLP人,我向百度致敬,致敬他们的勇气,致敬他们的努力和付出。



作者:Ann⁠⁣
链接:https://juejin.cn/post/7211116982513631292
来源:稀土掘金
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
收起阅读 »

还没用上chatGPT? 看看这几个替代方案吧

chatGPT面世都小半年了, 但是我总在使用的时候发现之前能访问的代理又挂掉了. 非常恼火. 于是楼主整理了一些低门槛且比较稳定的使用 chatGPT 的方案, 供掘友们参考: 1.NAT 该网站是 github 前 CEO, Nat Friedman 创建...
继续阅读 »

chatGPT面世都小半年了, 但是我总在使用的时候发现之前能访问的代理又挂掉了. 非常恼火.


于是楼主整理了一些低门槛且比较稳定的使用 chatGPT 的方案, 供掘友们参考:


1.NAT


该网站是 github 前 CEO, Nat Friedman 创建的, 集合了多种模型,


网站一个有趣的功能模块叫做 Compare, 提问一次可以对比多个模型的回答


image.png


免费+不用科学上网. 注册无需手机号, 只需要邮箱,


2.POE


POE 是国外问答网站 Quora 创立的, Quora大家应该都知道, 就相当于是国外版的知乎.


在POE集合了好几种大语言模型, 主要的两个是chatGPT 和 Claude.


Claude是 Anthropic公司出的模型, 它的最大特点是底层用卷积神经网络实现的, 在资源受限的环境下比较适用



Claude 是一种基于卷积神经网络 (Convolutional Neural Network, CNN) 的图像分类模型。该模型最初由 Google Brain 的研究人员开发,旨在提供一个高效且准确的图像分类解决方案。Claude 模型的设计基于 ResNet 架构,但引入了一些新的特性,包括 SE 模块和 Mixup 数据增强技术。这些特性使得 Claude 在 ImageNet 数据集上达到了 86.1% 的 Top-1 准确率和 98.7% 的 Top-5 准确率,超过了其他一些常用的模型,如 Inception-v3 和 ResNet-152。



image.png


注册需要提供邮箱+手机号. 亲测国内手机号可用


3.newBing


需要下载 Edge 浏览器, 注册一个微软账号, 并申请 newBing 体验


之前体验需要排队, 不过目前可以秒开体验资格


在使用体验上觉得 newBing 最好. newBing 的亮点是会给出信息来源网站, 以及会给出几个更具体更贴切的问题选项, 相当于用户就从做填空题变成了做选择题, 提问起来更高效


image.png


注意在使用 newBing 时候需要翻墙


4.其他国内代理服务


近期伴随着 chatGPT 的爆火, 也涌现了大量的国内代理, 这里就不一一介绍了. 不过国内代理的 chatGPT 服务与官网相比, 使用体验上还是差点, 而且有些代理商还会收费. 如果有能力的话, 还是建议自己注册chatGPT账号, 以获得最佳的使用体验。


结语


以上几种方案楼主都亲测可用. 在使用体验上, newBing 是最好的, 不过需要翻墙; NAT 有别致的 Compare 对比功能, POE 里有独特的卷积神经网络模型


大家可以自行选择, '驯服'属于自己的大语言模型.


作者:Jerakal
链接:https://juejin.cn/post/7212864793652117565
来源:稀土掘金
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
收起阅读 »

ChatGPT能否取代程序员?仍然是一个需要认真探讨的问题,对此你怎么看?

导言 ChatGPT能否取代程序员?作为一个AI语言处理程序,ChatGPT已经取得了重大的进展,它可以与人类进行流畅的对话,并能够接受和解释自然语言输入,并输出人类可理解、有意义的回复。然而,它是否能够取代程序员,仍然是一个需要认真探讨的问题。 ChatGP...
继续阅读 »

导言


ChatGPT能否取代程序员?作为一个AI语言处理程序,ChatGPT已经取得了重大的进展,它可以与人类进行流畅的对话,并能够接受和解释自然语言输入,并输出人类可理解、有意义的回复。然而,它是否能够取代程序员,仍然是一个需要认真探讨的问题。


ChatGPT的优势


首先,应该看到的是,ChatGPT具备的一些优势。ChatGPT已经被广泛应用于自然语言处理和对话生成等方面,这使得它可以代替程序员进行一些简单而重复性的工作。对于某些简单的外部调用或数据预处理等流程,ChatGPT可以通过自然语言输入和输出来完成,而无需程序员的干预。


此外,ChatGPT可以减少程序员在编写代码时的错误率。编程需要高度的精确性和细节,人们的犯错率很高,这是因为疏忽或思维方式不同。与人不同,ChatGPT能够在不需要任何帮助的情况下准确地执行指令,这意味着可以减少不必要的人为错误。


ChatGPT的缺陷和局限性


然而,ChatGPT作为一种工具,它仍然存在缺陷和局限性。 ChatGPT不能为程序员提供与业务需求紧密相连的解决方案。程序员不仅需要解决问题,还需要理解业务需求和目标,并设计出相应的解决方案。这需要程序员具备能力在技术和业务级别上进行交互,在这个问题上,ChatGPT的应用有限。



此外,ChatGPT无法在编程过程的所有阶段,提供与人类程序员相同或超过的创造性能力。创造力是人类的重要特征之一,表现在很多场合,如想象、创新等。在设计解决方案时,程序员需要花费大量时间进行创造性思考,以找到最佳的解决方案。这是ChatGPT无法做到的。


此外,ChatGPT也无法处理逻辑错误和紧急情况。在编程过程中,程序员需要处理各种问题和情况,如逻辑错误、紧急情况、文档和代码管理等。这些问题需要人类程序员处理,才能保证程序的稳定性和可靠性。 ChatGPT不能像人类程序员一样处理这些问题。


最后,需要考虑到的是,ChatGPT是AI的一种形式,它本身也存在缺陷和问题。在某些情况下,ChatGPT可能受到训练数据的影响,导致生成的结果不可靠。此外,ChatGPT还无法处理高度复杂的问题。这使得在某些情况下,程序员仍然需要进行人工编程。


总结


总的来说,ChatGPT可以在一定程度上替代程序员,但不能完全取代。尤其在需要进行创意思考、理解业务需求和解决紧急问题等方面,人类程序员的价值得到了体现,而ChatGPT的应用有限。ChatGPT和程序员是可以共存的,ChatGPT的发展将更加有助于程序员将更多的时间投入到解决问题本身。对此你怎么看?


作者:兴科Sinco
链接:https://juejin.cn/post/7213184860676210725
来源:稀土掘金
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
收起阅读 »

面向 ChatGPT 开发 ,我是如何被 AI 从 “逼疯” 到 “觉悟” ,未来又如何落地

对于 ChatGPT 如今大家应该都不陌生,经过这么长时间的「调戏」,相信大家应该都感受用 ChatGPT 「代替」搜索引擎的魅力,例如写周报、定位 Bug、翻译文档等等,而其中不乏一些玩的很「花」的场景,例如: ChatPDF :使用 ChatPDF...
继续阅读 »

对于 ChatGPT 如今大家应该都不陌生,经过这么长时间的「调戏」,相信大家应该都感受用 ChatGPT 「代替」搜索引擎的魅力,例如写周报、定位 Bug、翻译文档等等,而其中不乏一些玩的很「花」的场景,例如:




  • ChatPDF :使用 ChatPDF 读取 PDF 之后,你可以和 PDF 文件进行「交谈」,就好像它是一个完全理解内容的「人」一样,通过它可以总结中心思想,解读专业论文,生成内容摘要,翻译外籍,并且还支持中文输出等





  • BiBiGPT : 一键总结视频内容,主要依赖字幕来做总结,绝对是「二创」作者的摸鱼利器。





所以把 ChatGPT 理解为「搜索引擎」其实并不正确,从上述介绍的两个落地实现上看, ChatGPT 不是单纯的统计模型,它的核心并不是完全依赖于它的「语料库」,更多来自于临场学习的能力「 in-context learning」,这就是 ChatGPT 不同于以往传统 NLP「一切都从语料的统计里学习」的原因



当然,我本身并非人工智能领域的开发者,而作为一个普通开发者,我更关心的是 ChatGPT 可以如何提升我的开(mo)发(yu)效率,只是没想到随手一试,我会被 ChatGPT 的 「 in-context learning」 给「逼疯」。



ChatGPT & UI


相信大家平时「面向」 ChatGPT 开发时,也是通过它来输出「算法」或者「 CURD」 等逻辑居多,因为这部分输出看起来相对会比较直观,而用 ChatGPT 来绘制前端 UI 的人应该不多,因为 UI 效果从代码上看并不直观 ,而且 ChatGPT 对与 UI 的理解目前还处于 「人工智障」的阶段。



但是我偏偏不信邪。。。。。



因为近期开发需求里恰好需要绘制一个具有动画效果的 ⭐️ 按键,面对这么「没有挑战性」的工作我决定尝试交给 ChatGPT 来完成,所以我向 ChatGPT 发起了第一个命令:



「用 Flutter 画一个黄色的五角星」











结果不负众望,关键部分如下代码所示,Flutter 很快就提供了完整的 Dart 代码,并且还针对代码提供了代码相关实现的讲解,不过运行之后可以看到,这时候的 ⭐️ 的样式并不满足我们的需求。



此时顶部的角也太「肥」了 。











所以我随着提出了调整,希望五角星的五个角能够一样大,只是没想到我的描述,开始让 ChatGPT 放飞自我



也许是我的描述并不准确?




在我满怀期待的 cv 代码并运行之后,猝不及防的「五角星」差点没让我喷出一口老血,虽然这也有五个角,但是你管这个叫 「五角星」 ???



这难道不是某个红白机游戏里的小飞机??











甚至于在看到后续 ChatGPT 关于代码的相关讲解时,我觉得它已经开始在「一本正经的胡说八道」,像极了今天早上刚给我提需求的产品经理



哪里可以看出五个角相同了???




接着我继续纠正我的需求,表示我要的是 「一个五个角一样大的黄色五角星」 ,我以为这样的描述应过比较贴切,须不知·····



如下代码所示,其实在看到代码输出 for 循环时我就觉得不对了,但是秉承着「一切以实物为准」的理念,在运行后不出意外的发生了意外,确实是五个角一样大,不过是一个等边五边形。



算一个发胖的 ⭐️ 能解(jiao)释(bian)过去不?











再看 ChatGPT 对于代码的描述,我发现我错了,原来它像的是「理解错需求还在嘴硬的我」,只是它在说「这是一个五角星」的时候眼皮都不会眨一下



AI:确实五个角一样大,五个角一样大的五边形为什么就不能是五角星?你这是歧视体型吗?




所以我继续要求:「我要的是五角星,不是五边形」,还好 ChatGPT 的临场学习能力不错,他又一次「重新定义五角星」,不过我此时我也不抱希望,就是单纯想看看它还能给出什么「惊喜」



不出意外,这个「离谱」的多边形让我心头一紧,就在我想着是否放弃的时候,身为人类无法驯服 AI 「既爱又恨」的复杂情绪,让我最终坚持一定要让 ChatGPT 给我画出一个 ⭐️。










不过心灰意冷之下,我选择让 ChatGPT 重新画一个黄色五角星,没想道这次却有了意外的惊喜,从下面的图片可以看到,此时的 ⭐️ 除了角度不对,形状已经完全满足需求。



所以一个问题我多问几遍,也许就能接近我要的答案?




事实上这也是目前 ChatGPT 的现状,因为「临场学力」能力等因素影响,同一个问题它可能会给出不同的答案,而有的答案其实和我们要的根本不沾边










那么,接下来只要让 ChatGPT 把 ⭐️ 旋转一下角度,应该就可以完成需求····了吧?所以我提出「帮我旋转 180度」的要求。



结果不出意外的还是发生了意外,可能 ChatGPT 理解的 180 度和我不大一样,如下图所示,确实旋转了,只是还是歪的,而基于前面的尝试,我觉得有必要再给它一次机会。










终于,在我换了以下描述之后,ChatGPT 似乎「开窍」了,终于让我如愿以偿的得到了我想要的 ⭐️ 代码。



可以看到,其实这段代码并不复杂,你自己写或者去搜索引擎扒一扒大概会比用 ChatGPT 更快,但是 ChatGPT 的魅力就在于:它也许会错,但是总有一次它会「蒙对」,如果现在还不对,那么未来也会有算对的时候,这就是我感受到的 AI 魅力所在










既然五角星都出来,那么接下来我们来完成最后一步的动画效果,我们希望的是点击 ⭐️ 的时候可以有一个爆炸粒子的动画,所以我提出了:



「希望加上一个动画效果,就是点击的时候星星爆炸成颗粒的动画效果」




结果还是「一口老血」,如下图所示,「星星确实爆炸了」,只是这个爆炸动画看起来是那么的「一言难尽」,感兴趣的可以 cv 下面的源代码自己体验下,不出意外接下来又是新的一轮人类和 AI 的「斗智斗勇」。




class YellowStar extends StatefulWidget {
@override
_YellowStarState createState() => _YellowStarState();
}

class _YellowStarState extends State<YellowStar> with TickerProviderStateMixin {
bool _isExploded = false;
late AnimationController _animationController;
late Animation<double> _animation;

@override
void initState() {
super.initState();
_animationController = AnimationController(
duration: const Duration(milliseconds: 500),
vsync: this,
);
_animation = CurvedAnimation(
parent: _animationController,
curve: Curves.easeInOut,
);
}

@override
void dispose() {
_animationController.dispose();
super.dispose();
}

void _handleTapDown(TapDownDetails details) {
setState(() {
_isExploded = true;
_animationController.forward(from: 0.0);
});
}

void _resetStar() {
setState(() {
_isExploded = false;
_animationController.reset();
});
}

@override
Widget build(BuildContext context) {
return GestureDetector(
onTapDown: _handleTapDown,
onTap: _resetStar,
child: AnimatedContainer(
duration: const Duration(milliseconds: 500),
decoration: BoxDecoration(
color: Colors.white,
borderRadius: _isExploded
? BorderRadius.circular(50)
: BorderRadius.zero,
),
child: _isExploded
? _buildParticles()
: Container(
width: 100,
height: 100,
child: CustomPaint(
painter: YellowStarPainter(),
),
),
),
);
}

Widget _buildParticles() {
return AnimatedBuilder(
animation: _animation,
builder: (context, child) {
return Container(
width: 100,
height: 100,
child: Stack(
children: List.generate(
50,
(index) {
double radius = _animation.value * 50;
double angle = 2 * pi * index / 50;
double x = 50 + cos(angle) * radius;
double y = 50 + sin(angle) * radius;
return Positioned(
left: x,
top: y,
child: Container(
width: 4,
height: 4,
decoration: BoxDecoration(
shape: BoxShape.circle,
color: Colors.yellow,
),
),
);
},
),
),
);
},
);
}
}



class YellowStarPainter extends CustomPainter {
final double starSizeRatio = 0.4;
final double centerOffsetRatio = 0.2;
final double rotationOffset = -pi / 2;

@override
void paint(Canvas canvas, Size size) {
double starSize = min(size.width, size.height) * starSizeRatio;
double centerX = size.width / 2;
double centerY = size.height / 2;
double centerOffset = starSize * centerOffsetRatio;

Path path = Path();
Paint paint = Paint()
..color = Colors.yellow
..style = PaintingStyle.fill;

for (int i = 0; i < 5; i++) {
double radians = 2 * pi / 5 * i + rotationOffset;
double x = centerX + cos(radians) * starSize / 2;
double y = centerY + sin(radians) * starSize / 2;
if (i == 0) {
path.moveTo(x, y);
} else {
path.lineTo(x, y);
}

radians += 2 * pi / 10;
x = centerX + cos(radians) * centerOffset;
y = centerY + sin(radians) * centerOffset;
path.lineTo(x, y);
}

path.close();
canvas.drawPath(path, paint);
}

@override
bool shouldRepaint(CustomPainter oldDelegate) => false;
}

经过一轮「鏖战」如下图所示,面对同一个问题,ChatGPT 总能找到不同的实现方式来回答你,只是这些实现里有的无法运行的,有的是运行没有效果的,有的甚至是给你输出了一个 //TODO 爆炸动画 ,总之就是让你「血压飙升」。





当然,「胜利终将属于人类」,如下图所示,在经历了无数次「血压飙升」的场景之后,最终我还是得到了我想要的:点击 ⭐️,然后出现了💥的动画效果,尽管还是不完美,但是基本满足了我后续开发的需求。



这个代码完完全全由 ChatGPT 输出,我一句没改,完整代码贴在了后面。





class YellowStarPage extends StatefulWidget {
@override
_YellowStarPageState createState() => _YellowStarPageState();
}

class _YellowStarPageState extends State<YellowStarPage>
with SingleTickerProviderStateMixin {
late AnimationController _animationController;
bool _isExploded = false;

@override
void initState() {
super.initState();
_animationController =
AnimationController(vsync: this, duration: Duration(milliseconds: 500))
..addListener(() {
setState(() {});
});
}

@override
void dispose() {
_animationController.dispose();
super.dispose();
}

void _handleStarTap() {
if (!_isExploded) {
_isExploded = true;
_animationController.forward(from: 0);
Future.delayed(Duration(milliseconds: 500), () {
setState(() {
_isExploded = false;
});
});
}
setState(() {});
}

@override
Widget build(BuildContext context) {
return Scaffold(
appBar: AppBar(title: Text('Yellow Star')),
body: Center(
child: GestureDetector(
onTap: _handleStarTap,
child: Container(
width: 300,
height: 300,
child: AnimatedBuilder(
animation: _animationController,
builder: (context, child) {
return CustomPaint(
painter: YellowStarPainter(_animationController.value,
isExploded: _isExploded),
);
},
),
),
),
),
);
}
}

class YellowStarPainter extends CustomPainter {
final double starSizeRatio = 0.4;
final double centerOffsetRatio = 0.2;
final double rotationOffset = -pi / 2;

final double animationValue;
final bool isExploded;

YellowStarPainter(this.animationValue, {this.isExploded = false});

@override
void paint(Canvas canvas, Size size) {
double starSize = min(size.width, size.height) * starSizeRatio;
double centerX = size.width / 2;
double centerY = size.height / 2;
double centerOffset = starSize * centerOffsetRatio;

Path path = Path();
Paint paint = Paint()
..color = Colors.yellow
..style = PaintingStyle.fill;

if (isExploded) {
double particleSize = starSize / 30;
paint.strokeWidth = 1;
paint.style = PaintingStyle.fill;
paint.color = Colors.yellow;
Random random = Random();

for (int i = 0; i < 30; i++) {
double dx = random.nextDouble() * starSize - starSize / 2;
double dy = random.nextDouble() * starSize - starSize / 2;
double x = centerX + dx * (1 + animationValue);
double y = centerY + dy * (1 + animationValue);

canvas.drawCircle(Offset(x, y), particleSize, paint);
}
} else {
for (int i = 0; i < 5; i++) {
double radians = 2 * pi / 5 * i + rotationOffset;
double x = centerX + cos(radians) * starSize / 2;
double y = centerY + sin(radians) * starSize / 2;
if (i == 0) {
path.moveTo(x, y);
} else {
path.lineTo(x, y);
}

radians += 2 * pi / 10;
x = centerX + cos(radians) * centerOffset;
y = centerY + sin(radians) * centerOffset;
path.lineTo(x, y);
}

path.close();
canvas.drawPath(path, paint);
}
}

@override
bool shouldRepaint(CustomPainter oldDelegate) => true;
}


最后,给大家欣赏一下我让 ChatGPT 画一只米老鼠的「心路历程」,很明显这一次「人类一败涂地」,从目前的支持上看,让 ChatGPT 输出复杂图像内容并不理想,因为它不的笔画「不会拐弯」。













真的是又爱又恨。



最后


经过上面的一系列「折腾」,可以看到 ChatGPT 并没有我们想象中智能,如果面向 GPT 去开发,甚至可能并不靠谱,因为它并不对单一问题给出固定答案,甚至很多内容都是临场瞎编的,这也是因为大语言模型本身如何保证「正确」是一个复杂的问题,但是 ChatGPT 的魅力也来自于此:



它并不是完全基于语料来的统计来给答案



当然这也和 ChatGPT 本身的属性有关系, ChatGPT 目前的火爆有很大一部分属于「意外」,目前看它不是一个被精心产品化后的 2C 产品,反而 ChatPDFBiBiGPT 这种场景化的包装落地会是它未来的方向之一。


而现在 OpenAI 发布了多模态预训练大模型 CPT-4GPT-4 按照官方的说法是又得到了飞跃式提升:强大的识图能力;文字输入限制提升至 2.5 万字;回答准确性显著提高;能够生成歌词、创意文本,实现风格变化等等



所以我很期待 ChatGPT 可以用 Flutter 帮我画出一只米老鼠, 尽管 ChatGPT 现在可能会让你因为得到 1+1=3 这样的答案而「发疯”」,但是 AI 的魅力在于,它终有一天能得到准确的结果


作者:恋猫de小郭
链接:https://juejin.cn/post/7210605626501595195
来源:稀土掘金
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
收起阅读 »