交大AI实战笔记

实验环境:anaconda3.7+python3.6

实验框架:tensorflow1.9+keras2.2

实验数据:imagenet+coco+github

实验组件:tensorboard(查看模型训练过程)

1.图片分类

工具:inception

用途:识别动物、花朵种类

2.目标检测

工具:tensorflow目标检测api+opencv

用途:检测摄像头、图片、视频目标

3.手部检测

工具:labelimg(打标工具)

用途:检测手部

4.生成对抗网络

工具:MNIST

用途:生成手写文字

工具:DCGAN、WGAN、CGAN、ACGAN、CelebA

用途:生成人脸

工具:Illustration2Vec(标签提取)+chainer(AI框架)

用途:二次元头像生成

5.pix2pix图像翻译

工具:pix2pix

用途:图片上色

6.性别转换

工具:CycleGAN

用途:性别转换、换脸、去马赛克、穿(脱)衣、直播换头

7.人脸图片处理

工具:Dlib

用途:人脸检测、人脸关键点定位、人脸识别、人脸聚类、目标追踪

8.图像风格迁移

工具:VGG16+VGG19

用途:图像风格化

9.中文词向量

工具:gensim

用途:中文词关联

10.中文分词

工具:jieba

用途:中文词汇分离

11.DQN(自动游戏)强化学习

工具:pygame

用途:训练AI自动玩游戏

12.图像标题生成

工具:VGG19

用途:显示图像类型

13.seq2seq机器翻译

工具:nmt

用途:中英文翻译、对联生成

14.语音识别

工具:ffmpeg+wavenet+ctc(计算损失函数)

用途:识别语音

15.方言分类

工具:wavenet+ctc

用途:分类方言

 

 

 

 

 

 

 

Go、R、Python、Node谁将是最后的王者?

在这四种语言中,数go语言速度最快,可嵌入c,支持并发,且有google这个后台背书。

而R语言,优势是统计分析和可视化。

至于python,扩展较多,可爬虫、可建站、可AI、可上链。

而node,现在发展迅猛,目前已经在制定ecma2019标准,目标是one node,ererywhere~

重点介绍一下node.js。原本是一个借助chrome v8引擎的js后端语言。操作数据库主要是通过websql、sqlite以及IndexedDB。而实现everywhere,主要是通过electron打包成桌面端,cordova打包成移动端。

通过tfjs,可以进行深度学习开发;通过babylon.js,可以开发3D游戏;通过noble,可以连接蓝牙……

可以说,node无所不能,且轻量,便捷。

2019智能手机展望

1.支持5g

速度更快,信号更好

2.支持无线充电

可以使用无线充电器充电

3.折叠屏幕

不是翻盖和滑盖,而是屏幕折叠

4.2+1卡槽

2个sim卡槽,1个tf卡槽

5.红外支持

可以连接家电设备,作为遥控器

6.nfc支持

可以快速刷交通卡和门禁

7.fm支持

可以接收fm广播

8.type-c接口

充电更快更安全

9.大容量锂电

不再为充电宝烦恼

10.智能耳机

ai耳机,带锂电,支持tf卡,可离线播放音乐和音频,可接电话和切歌,能一键切换成翻译器,带语音控制

11.ai芯片

支持离线语音助手,离线美颜,离线翻译

12.支持otg

可以插u盘

13.单反级镜头

支持高倍光学变焦

14.钢化屏

不需要贴膜的屏幕

15.多模gps

同时支持gps,北斗,伽利略等卫星系统

16.智能节流

唤醒时使用5g,睡眠时降级

17.超大屏幕

接近7寸的屏幕,电脑手机一体

18.手机键盘

手机可外接键盘

19.手机屏幕放大器

放大手机屏幕,方便键盘操作和老年人

20.手机电容笔

可触控,可作画

21.闪光手机壳

来电可发光的手机壳

22.放电模式

手机可以给电脑或其他手机充电

23.迷你屏

折叠后背面展示迷你屏,用于显示时间

24.5摄像头

正面1个摄像头,用于自拍和人脸识别,背面4个,分别是长焦,短焦,鱼眼,标准镜头

25.陶瓷机身

不易碎,隔热,触感好

26.定制姓名

可激光定制姓名和短语

27.音量无级调控

齿轮式音量调节,精细到0.1db

28.指纹识别

全屏指纹识别

29.人脸识别

支持夜视的人脸识别系统

30.8位密码系统

6位数字密码升级为8位,更安全