为安卓猿准备的Google I/O 2024省流版
前两天一年一度的谷歌开发者大会Google I/O 2024在大洋彼岸如期举行,在会上谷歌发布了一系列最新的技术。本文将以Android开发为核心来汇总一下大会的内容。
Android 15 Beta 2来了
自从Android站稳了脚跟以后(大概是在Android 4.3之后)基本上就是每年一个大版本的节奏,一般是在春季有预览版本,在秋季正式发布。为了抢在水果的前面,也都会在Google I/O时进行重点的宣传,所以每年的Google I/O一大看点就是新一代的Android。当然了,从去年开始AI变成了焦点,但是回到前几年时Android是绝对的焦点。
今年也不例外,在Google I/O上面也宣传了一下Android 15,并正式发布了第2个Beta版本,从功能和Feature角度来说,这个就非常接近于正式版本了。不过就如我在前面一篇文章中提到的那样,Android 15其实没啥亮点,主要集中在安全和隐私方面的加强,其余的改进也都非常的小。
关于Android 15具体的改动,可以看一下前排大佬的总结,总结的比较详细,就不重复了。
想体验Android 15 Beta 2的话,如果是谷歌的设备如Pixel系列,应该就有推送了。另外就是现在谷歌都会与厂商联动一起发布新版Android的Beta版本,这已经是好几年的传统了。就比如像小米,在15号大半夜(准确地说是16号凌晨)发布了四款机型的Android 15 Beta OTA包,手头有设备的可以体验一下。
再说一下Android 15(targetSdk 35)的适配,如前所述这一版本较上一代没啥变化,如果本身就已经适配到了Android 14(targetSdk 34),就不用再特殊适配了。
AI霸屏
从去年开始AI就是巨头们的焦点,今年更是霸屏,整个Keynote全是关于AI的,唯一提到Android的地方,也是说在Android手机上如何使用AI。在大模型这条赛道上Google是追随者,就在Google I/O前两天还被Open AI给抢了热度给恶心了一把,劈柴大叔今年略忧伤,讲Keynote的时候有点无精打彩,完全没了前几年那种激情四射。
今年Google发布了Gemini 1.5 Pro,支持1M的上下文Token,大约可以记得1500份PDF,并且演示了很多大模型的具体应用场景,像搜索,图片处理以及文字和代码生成助手。
当然,Android开发者更应该关注的是在端侧部署的大模型。时至今日,大模型已经进入了平稳提升期,大家都是在做出更强大的模型,比如参数更多,上下文更长等等。但大模型仍有一个短板就是无法在端侧的部署,特别是移动设备,如手机,平板,车机,甚至手表等,因受制于性能。目前来说,端侧使用大模型都还是使用网络API的方式,一方面这会依赖于网络,但更重要的是,这会受制于安全和隐私。端侧大部分的数据,是不能直接,也不太可能全都上传到服务器。因此端则部署大模型还是有价值可挖的,比如说对于设备的运行数据,以及像用户一些不愿分享的数据,就可以直接用端侧的大模型来直接处理。
Google发布了端侧的大模型Gemini Nano,将会集成在Android 15之中,并且它支持多模态,还是值得期待的。不过呢,目前Gemini Nano也没有具体的API,谷歌也只给了一个空头支票,在手机上选择文字,然后端侧大模型就可以求解其中的数学题。说实话,这个举例场景的不够好,写作业的场景,作业题怎么可能出现在手机里,然后还是现成的文字?也说明美帝的学生不够卷,在我朝,早就有了作业帮,猿辅导之类的拍一下题目就能给出详细求解过程。
不过Android生态一向受制于厂商,谷歌能做的事情并不多,估计只在谷歌的官方设备(Pixel)中可以用,其他的还是要靠厂商。这点就比不上水果,相信在6月份,水果应该会拿出更为接地气(有实际场景应用和开放API)的端侧大模型集成方案。
Android开发工具
这次谷歌把其大模型Gemini应用到了很多具体的场景中,Android开发官方IDE Android Studio新版本Koala中就深度绑定了Gemini,可以用来生成代码,分析代码和帮助解决其他编程问题。
除了代码,此外Gemini还能帮忙分析错误报告,以及生成集成有Gemini API代码的项目,可见Gemini已经深度融合进了Android Studio之中。详细的可以看一看官文档。看着都挺美好 的,但其实最想知道的问题是,是否会对我们东方大国开放使用?
其他的都是一些常规的小的提升,如可穿待设备的不同模式下的预览,Compose的实时编辑以及Compose Glance(桌面小部件)预览, 以及Android Studio Profiler的改进等等。
Android开发套件
对于Android相关的开发套件,唯一提到的都是与Jetpack Compose相关的,可见谷歌对它的重视。新东西也都中规中矩,主要是在动画上面,如分享页过渡,可复用列表(Lazy list)元素的动画;文本控件支持HTML了;一个新的布局ContextualFlowRow,用以实现复杂的可复用流式布局,这个还是挺有用的;以及性能提升。详细内容可以看官方博客。
Jetpack Compose对于常规的UI来说已经没有问题,但是对于一些专业领域的UI还是无法胜任,比如像相机,视频和图像的预览和渲染还是无法在Compose中使用。好消息是,现在Google已经着手处理了,这次就基于CameraX搞了一个camera-viewfinder-compose,能够在Compose中显示相机预览。
再有就是Kotlin Multiplatform,这个是Jetbrains在主要搞的东西,谷歌也加大了配合力度(First class support),比如已经把一些Jetpack中的库添加了对KMM的支持。
参考资料
来源:juejin.cn/post/7369527074590343219