2024,越来越热的一年。

木匠师傅、吾葆兄、卡童新年好!



梧桐好!祝你们全家龙年吉利,也盼龙年风调雨顺。

海晏阁下方老庙黄金银楼上的盘龙是真有的,对吧,做上去不容易的。

祝梧桐春节快乐。 你们那里已经春意盎然了, 我们这里昨天又下了场雪。 也算弥补了这个冬天的雪量不足。

一位网友说她每年都种菜,自给自足。在当前这个物价高涨的年代,尤其显得高明。试着用AI 描绘一下菜农的丰收心情。

上面有点严肃了,不喜悦,修改一下。

别的不说,进来AI图片手指头大有进步:

让它换个中国脸,马上就得:

你这个蔬菜描绘的非常准确。菜和人一样水灵。

我用SDXL版就很慢,转不起来了。

我们是不是已经掉进了资本设计的圈子?现在发觉,往往我们所想的,就是人家设计的结果。比如使用AI,你就得有比较好的显卡。

我说,我家在多伦多,2月中旬又一场大雪。我输入我家的房子,结果AI就给我整了这么一张图:

我说,原来是有树的,被砍了。AI大概认为我在怀念以前的树,就体贴地加上了树。。。不过,这也不像我家啊。

这个技术要是早来20年,那时我差不多一星期都会写一两篇小故事。就很容易给自己写的每一篇东西配图了。

我觉得,AI知道一点就行。比如说现在出来的 Sora 制作短片,的确太厉害了,因为我们要跟的话,首先要有硬件上的实力。

过了元宵节,就盼着春暖花开。

都说今年是暖春,可今天早上还零下十度。

今天下午出门,去打儿子家了,有太阳,依旧冷得紧。

In Toronto on February 24th, it was dry and cold. The trees on the roadside were still bare. There was sunshine, but it was not warm.

元宵节,中国的情人节,

我大姐长住宜昌,初十大姐全家7人到武汉,正遇上先是下一层雪子,然后下冻雨,妥妥地把武汉变成了一个大溜冰场。说实话,我还真没见过武汉的这个样子;很多老武汉都说今年太稀罕,太喜庆了。

还有朋友说:今年大家都去哈尔滨看冰雪,费那个劲干嘛,这不现成的哈尔滨武汉分滨么。。。

南方人没见过大面积的雪地,肯定看的新鲜,特别是孩子们更新奇。

在国内网站看到一个SD的网站,竟然可以在上面直接画图,我有国内的电话号码,所以就登陆了进去,试着画了一张图,还是XL模型的,效果还不错,也挺快。他的提示词也很贴心地可以帮助中文翻译成英文。

有点儿类似这里的Midjourny网站。 不知你的朋友是否用的这个网站。

liblibai


+: A girl, smiling, stood in the vegetable field in the backyard. The box in her hand was filled with celery, cream cabbage, tomatoes and cucumbers. The sky was clear. 4k,8k, portrait,
-: Adult Image, Mutilated Hand

加一个面部修复

用的国内人写的模型,特意挑了一些中国蔬菜,看模型识别不识别。 上次我写的lora 对于花卉只认英文名称,不识别拼音。 后来尝试专写一个中国蔬菜的Lora,虽然输入进去英文名称,但效果不是很好,还没想好怎么改进。

国内要不了多久,就会超越我们这边统称使用的这些,模型的建立取材不同,所以更适合我们用。

我在做汤米汤普森公园的视屏短片时,让AI帮我生成一些在汤米汤普森公园抓鱼的画面:

这些画一出来,我就有一种似曾相识的感觉,就觉得在哪儿见过。一会儿就想明白了,我刚到美国时,为了把英文弄好一点,我阅读了大量的地铁站小说——80年代在每个地铁站都有摆卖这样一些小说的:

终于想起来了,这本书就是地铁站小说插图的风格。可以说明,很多人做模型,大量地使用了地铁站小说插图图片。

我拍摄的这一套书,因为可以给孩子读,我就留下来了,其它的读完就扔了。右上角这本书定价为1.95美元,我购买的时候,应该都是半价,也就是说,大约90美分或者一美元一本。

是的,现在许多画家的绘画风格被做成模型,供人选用。过不了多久,画家也会失业。

你现在视频素材有了,插图也有了,再找一个原音克隆配音,再找一个流量大的载体,过不了多久你就成了新媒体作家了。 :rofl:

苦口婆心。

模拟的声音效果挺好。 :rofl: 连方言都模拟出来了。

神了,真的很像我读稿子。携带了一点点我的口音。

我猜,做模型的时候,不能用有音乐的样本录音吧?这里是我做短片时,没有修饰的录音原始文件:

猝死的彼得(简).pdf (140.9 KB)

我自己也用你介绍的 https://ttsmaker.com/ 做过,但效果没有你做的这么好。。。

这是刚刚发布的AI软件, 中国人做的,据说反应还不错。

链接在这里: 24天9.3k star! GPT-SoVITS语音克隆超详细教程 - 知乎

我用了本地部署,你的声音母本我用的你先前在网上放的朗读音频。所以符合你的声音 :sweat_smile:

我后来传上去的是后期加工的,音乐是后加的。软件做出来的效果还是挺好的:

录音中有些间断,是因为输入朗读文本时中间有段落空白,在输入时把段落空白缩短就不会有了。

后期加音乐合成后效果变差了。需要改进。

基本上它做出来的模型可以符合音源母本的声调。

这个软件还在开发中,期待更大的进步。

这个是用peter sound为母本声源做的, 基本模拟了朗读者的语调;