​左手 Serverless,右手 AI,7 年躬身的古籍修复之路

news/2024/4/19 17:16:38/

作者:宋杰

“AI 可以把我们思维体系当中,过度专业化、过度细分的这些所谓的知识都替代掉,让我们集中精力去体验自己的生命。我挺幸运的,代码能够有 AI 辅助,也能够有 Serverless 解决我的运营成本问题。Serverless 它是一个 Game Changer,就是彻底改变云计算模式的创新。

我叫宋杰,是一个上海人。从初级的程序员一直到做企业的架构工作,现在是在利用 IT 技术做古籍方面的开发与利用。

数字化对古籍有一个非常大的好处在于它的修复是异常高效的,传统的古籍修复对人才的要求门槛是很高的,但数字化就创造了另外一种可能。首先,修改相对简单,另外,它还可以做版本跟踪。 即便我这一次修复不成功,后面的人可以根据原始图片再次修改,让古籍资源能够充分地活化起来。

机缘巧合下,我承担了这个任务。

印藏项目源于香港的一位私人收藏者,他收藏了历朝历代的印谱后把这些印谱的数字化版本,无偿的捐献给了复旦大学图书馆。

图片

我第一次尝试着以 IIIF 对印藏项目进行大规模的呈现。在互联网这样可能产生极高流量波峰波谷的环境下,到底怎么去设计它的架构,才能既满足业务的需要,又比较经济呢?

阿里云提供的 Serverless 技术尤其是函数计算产品,对于整个项目帮助极大,它性价比相当的高,根据经验估算来说,每次收费基本上是等于单机开发的 10%。

其实像复旦大学印谱文献虚拟图书馆这样的网站,它的原始图像就有 3TB,近 50 万张图片,包括现在已经用 AI 识别的图片,整个运营费用一年下来也就几千元,而传统的方式一个月的话就要花费 2000 元左右。

图片

原来大家做网站开发,第一考虑是要用什么 web 服务器,后端用什么数据库。但 Serverless 出现之后,已经把底层的这些操作系统、应用软件、容器编排全部抽象掉了。

对大多数程序员来说,需要解决的是领域问题。不用去关心下面的运维问题,只需要把精力投入在怎么解决业务问题上去。

在计算方面,Serverless 也彻底帮助我们做到了计算和存储分离,算力的估算方式就发生了变化。在 Serverless 的环境当中,我们只需要指定它的内存大小、运行时间,给到这两个参数就可以把算力定下来了。而且你能支配的总容量其实是没有上限的,让程序员能彻底集中精力做应用的事。

图片

我现在做的项目,叫易图 IIIF 文化遗产图像解决方案,它是一个平台,可以说是对印藏项目的一般化。对于一些中小型的机构,甚至是个人收藏爱好者,他只要在网页上进行上传,就能够出现一个跟印藏一样的网站,这是我个人的创业项目。

“我的左手是 Serverless,右手是 AI”。 强人工智能是一定高度依赖于文化的,在某一个文化领域当中产生出符合文化与价值观、审美倾向,包括对世界的基本认知的一个智能的大模型。

要知道模型都挺大的,至少不能让我等 1 分钟才看到推理结果。阿里云通过函数计算来做 GPU 应用,并自研一套镜像快速部署方案,我的感受是体验非常流畅。同时整个过程是按需计费的,这对所有开发 AI 应用程序的程序员来说是一个福音,彻底让程序员能够集中精力做应用的事情。

我们迎来了开发者最好的时代。

古籍识别体验场景全新上线

中华古籍浩如烟海,对珍贵古籍进行保护、修复和活用,关乎中华文脉的延续和传承。随着数字技术不断成熟,古籍正走出“深闺高阁”,资源会得到更有效利用。轻点鼠标、一键部署,儒家经典《论语》可逐页在线阅览,古籍还能实现繁体字和简体字转换等功能,让读者能查询、会阅读。

为了让更多人了解古籍修复,宋杰与阿里云函数计算团队合作,通过函数计算一键搭建古籍识别平台,排版形式既符合现代人的阅读习惯,又还原了古籍纸张的阅读美感。欢迎大家参与到古籍修复的活动中,让古籍更好地走进千家万户。

图片

点击下方链接,参与古籍修复,用数字技术助力古籍活化。

https://developer.aliyun.com/topic/fcrepair


http://www.ppmy.cn/news/1149066.html

相关文章

CTF Misc(3)流量分析基础以及原理

前言 流量分析在ctf比赛中也是常见的题目,参赛者通常会收到一个网络数据包的数据集,这些数据包记录了网络通信的内容和细节。参赛者的任务是通过分析这些数据包,识别出有用的信息,例如登录凭据、加密算法、漏洞利用等等 工具安装…

VUE echarts 柱状图、折线图 双Y轴 显示

weekData: [“1周”,“2周”,“3周”,“4周”,“5周”,“6周”,“7周”,“8周”,“9周”,“10周”], //柱状图横轴 jdslData: [150, 220, 430, 360, 450, 680, 100, 450, 680, 200], // 折线图的数据 cyslData: [100, 200, 400, 300, 500, 500, 500, 450, 480, 400], // 柱状图…

VR全景营销颠覆传统营销,让消费者身临其境

随着VR的普及,各种VR产品、功能开始层出不穷,并且在多个领域都有落地应用,例如文旅、景区、酒店、餐饮、工厂、地产、汽车等,在这个“内容为王”的时代,VR全景展示也是一种新的内容表达方式。 VR全景营销让消费者沉浸式…

基于Vue构建的快速开发框架

一、Vue结合低代码 "低代码"是一种快速开发应用的方法,它使开发者能够通过图形界面和预构建的块进行设计和构建,而不是手动编写大量的代码。这种方法被广泛用于快速应用开发、移动应用开发、业务流程管理和数据库应用开发等领域。 Vue.js 是一…

spring 注入 当有两个参数的时候 接上面

新加一个int 型的 age 记得写getset方法和构造方法 ((((((( 构造方法的作用——无论是有参构造还是无参构造,他的作用都是为了方便为对象的属性初始化值 构造方法是一种特殊的方…

虹科方案 | 虹科ATTO加速虚拟存储管理

虹科方案 | 虹科ATTO加速虚拟存储管理 文章来源:虹科网络安全 点此阅读原文:https://mp.weixin.qq.com/s/SYruurSQSodUvyhZBr-BMQ 1 方案背景 企业越来越多地转向服务器虚拟化,以有效利用硬件资源、降低运营成本,并为维护和灾难恢…

达梦数据库常用命令

解锁用户 -- 解锁因多次登录失败被锁定的用户 alter user "${USERNAME}" limit failed_login_attemps unlimited,PASSWORD_LOCK_TIME UNLIMITED; alter user "${USERNAME}" account unlock; commit;查询数据库版本 select * from v$version;查看授权信息…

每年高考时间是几月几号 高考开始时间

高考是高中生最重要的一个阶段,甚至影响着很多学生的未来,相信大家都很关注高考的具体时间是什么时候,本次将详细给您介绍高考的具体开始时间以及结束时间。 每年高考的时间都是6月7日开始,一共持续三天时间左右,但是…

口袋参谋:淘宝卖家必备的市场调查分析工具!

​在淘宝天猫上开店,首先想到的第一个问题就是——卖什么? 想要解决这个疑问,我们就需要对一些你选的品类做市场调查,根据市场调查分析得出了结论,哪个市场竞争力小,那就卖哪个! 卖家做市场调查…

linux上storcli工具安装及使用

StorCLI即Storage Command Line Tool 是LSI公司开发的RAID卡命令行管理工具。主要用于服务器内部RAID管理。 安装storcli前,服务器本地硬盘故障更换过程中,在message中只有如下2行日志,无法得到详细信息 # dmidecode |grep Product Pr…

测试驱动开发与极限编程思想浅析

随着全球经济的发展与计算机技术的普及,各行业对计算机软件的需要量日益增加。与此同时对软件的质量要求也越来越高。而与之形成鲜明对比的是,随着软件需要的增加和规模的增大,能做出及时交付给用户以及让用户满意的软件却变得难上加难。传统…

代码随想录二刷day59

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言一、力扣503. 下一个更大元素 II二、力扣42. 接雨水 前言 一、力扣503. 下一个更大元素 II class Solution {public int[] nextGreaterElements(int[] nums) {…

【C#】什么是并发,C#常规解决高并发的基本方法

给自己一个目标,然后坚持一段时间,总会有收获和感悟! 在实际项目开发中,多少都会遇到高并发的情况,有可能是网络问题,连续点击鼠标无反应快速发起了N多次调用接口, 导致极短时间内重复调用了多次…

Autosar CAN开发12(基于CAN收发器的休眠唤醒、CAN收发器模式讲解。详细讲解TJA1059(TJA1049)、TJA1043、TJA1145。)

入职新公司短短几个月让我搞遍了整整3种CAN收发器。真的是又爱又恨。。。 目录 关于我对CAN收发器理解的历程。 什么是CAN收发器 基础版CAN收发器:TJA1059(TJA1049)收发器 TJA1049 引脚图: TJA1049 收发器模式及各个模式切换…

python关联分析实践学习笔记

曾经有个沃尔玛超市,它将啤酒与尿布这样两个奇怪的东西放在一起进行销售,并且最终让啤酒与尿布这两个看起来没有关联的东西的销量双双增加。 我们关注的是在这样的场景下,如何找出物品之间的关联规则。接下来就来介绍下如何使用Apriori算法&…

JVM面试题:(三)GC和垃圾回收算法

GC: 垃圾回收算法: GC最基础的算法有三种: 标记 -清除算法、复制算法、标记-压缩算法,我们常用的垃圾回收器一般 都采用分代收集算法。 标记 -清除算法,“标记-清除”(Mark-Sweep)算法,如它的…

Matlab提取colormap

文章目录 简介Matlab代码 简介 使用Maltab依据截取的图片信息,提取colormap,供保存使用 Matlab代码 提取函数 function colormap_outExtract_Colormap(inputfig, colormapsize)% Creat a colormap array from the input figure. % The figure is a c…

Redis-集群

Redis-集群 主从复制和哨兵只能在主节点进行写数据,从节点读取数据,因此本质上,是进行了读写的分离,每个节点都保存了所有的数据,并不能实现一个很好的分布式效果。 1.哈希求余算法 假设有N台主机,对每台…

计算mask的体素数量

import numpy as np import nibabel as nib # 用于处理神经影像数据的库 # 从文件中加载mask图像 mask_image nib.load(rE:\mask.nii.gz) # 获取图像数据 mask_data mask_image.get_fdata() # 计算非零像素的数量,即白质骨架的体素总数 voxel_count np.count_no…

【vue3+ts】项目初始化

1、winr呼出cmd,输入构建命令 //用vite构建 npm init vitelatest//用cli脚手架构建 npm init vurlatest2、设置vscode插件 搜索volar,安装前面两个 如果安装了vue2的插件vetur,要禁用掉,否则插件会冲突