###pdf转化为图片###

news/2024/4/20 14:55:13/
import sys, fitz
import os
import datetimedef pyMuPDF_fitz(pdfPath, imagePath):startTime_pdf2img = datetime.datetime.now()  # 开始时间print("imagePath=" + imagePath)pdfDoc = fitz.open(pdfPath)for pg in range(pdfDoc.pageCount):page = pdfDoc[pg]rotate = int(0)# 每个尺寸的缩放系数为1.3,这将为我们生成分辨率提高2.6的图像。# 此处若是不做设置,默认图片大小为:792X612, dpi=72zoom_x = 1.33333333  # (1.33333333-->1056x816)   (2-->1584x1224)zoom_y = 1.33333333mat = fitz.Matrix(zoom_x, zoom_y).preRotate(rotate)pix = page.getPixmap(matrix=mat, alpha=False)if not os.path.exists(imagePath):  # 判断存放图片的文件夹是否存在os.makedirs(imagePath)  # 若图片文件夹不存在就创建pix.writePNG(imagePath + '/' + 'images_%s.png' % pg)  # 将图片写入指定的文件夹内endTime_pdf2img = datetime.datetime.now()  # 结束时间print('pdf2img时间=', (endTime_pdf2img - startTime_pdf2img).seconds)if __name__ == "__main__":pdfPath = '2.pdf'   # pdf文件名imagePath = 'book'  # 提取出的pdf,转化的图片存放的文件夹名pyMuPDF_fitz(pdfPath, imagePath)def to_page(file_img):image = Image.open(file_img)image_arr = np.array(image)for i in range(len(image_arr)):t = 0for j in range(len(image_arr[0])):if not str(image_arr[i][j]) == '[255 255 255]':t += 1if t >= 300:return Trueif t != 0:return Falsedef page(path):path = list(path)path[-5] = str(int(path[-5]) + 1)path = ''.join(path)if to_page(path):results = OCR(path)for re in results:re[0][0][1] += 1100re[0][1][1] += 1100re[0][2][1] += 1100re[0][3][1] += 1100return resultsreturn None
def to_page(file_img):image = Image.open(file_img)image_arr = np.array(image)for i in range(len(image_arr)):t = 0for j in range(len(image_arr[0])):if not str(image_arr[i][j]) == '[255 255 255]':t += 1if t >= 300:return Trueif t != 0:return Falsedef page(path):path = list(path)path[-5] = str(int(path[-5])+1)path = ''.join(path)if to_page(path):results = OCR(path)for re in results:re[0][0][1] += 1100re[0][1][1] += 1100re[0][2][1] += 1100re[0][3][1] += 1100return resultsreturn None

 


http://www.ppmy.cn/news/717932.html

相关文章

html2img 将HTML转化为图片

步骤 1. 用浏览器显示html 2. 截屏 3. 后处理,截取有效部分 代码 import os import pyppeteer from pyppeteer import launch import asyncio import cv2async def get_jpgs(html_path, img_path):browser await launch()page await browser.newPage()await …

将div转化为图片并下载

一&#xff0c;引入相关库 <script src"js/jquery-1.8.2.js"></script> //兼容ie <script src"js/bluebird.js"></script> //html转canvas <script src"js/html2canvas.min.js"></script>//二&#xff0c;…

链接批量转化为图片预览

链接批量转化为图片预览 1、按照下列排列 2、复制A、B、C列到txt文本&#xff0c;调整格式 初始格式如下&#xff0c;红色部分有tab键&#xff0c;打开替换功能 3、替换上方红框空白部分 4、修改好后&#xff0c;复制粘贴到excel表格里 5、删除不需要的数据

hevc 继续色度半像素差值

1 前面已经讲了亮度的半像素差值&#xff0c;接下来讲一下色度的半像素差值。 亮度分量的运动估计已经精确到了1/4的精度&#xff0c;并且速度分量的分辨率是亮度分量的一般&#xff0c;所以色度插值需要精确到1/8的精度&#xff0c;色度分数像素插值按照基于离散余玄变换的4抽…

计算机桌面上的照片转pdf免费,如何把图片转化为pdf,图片转换pdf工具推荐

我们经常遇到要将图片转换成pdf文件输出的情况&#xff0c;那么我们有什么办法能更快更好进行转换呢&#xff1f;小编今天给大家带来两个办法&#xff0c;一个是手机上操作的&#xff0c;另一个是电脑上的方法&#xff0c;实测好用&#xff01; 手机端转换 手机上小编一般会使用…

利用freemarker+html2image将html转化为图片

前言&#xff1a;接上篇freemarker生成word后&#xff0c;因为我们生成的是假word文档&#xff0c;底层还是xml&#xff0c;微信等app识别不了(目前还没有较好的技术解决这个问题&#xff09;。所以产生了新的需求&#xff0c;把word的内容生成张图片。这样就可以在app端查看。…

ppt调整版式尺寸大小为16:9,调整图片尺寸为16:9

总结如下&#xff1a; 1、调整版式为16:9&#xff1a; 2、图片调整尺寸为16:9&#xff0c;这样就可以覆盖为ppt背景。

将H5页面转化为图片

使用html2canvas插件&#xff0c;详情&#xff1a;http://html2canvas.hertzen.com/ 实例代码&#xff1a; html <div id"capture" style"padding: 10px; background: #f5da55"><h4 style"color: #000; ">Hello world!</h4> &…

图片怎么转化为pdf格式?

图片现在已经成为大多数朋友经常接触使用的文件格式&#xff0c;就像我们每个人手机里都存有大量的照片&#xff0c;所以说图片是大家日常接触使用最多的文件格式。但是大量的图片在使用储存的时候&#xff0c;确实很麻烦&#xff0c;无论我们上传到网络云盘&#xff0c;还是储…

如何将jpg等格式的图片转化为yuv

1. 下载ffmpeg&#xff0c;转码图片和视频的利器啊&#xff01;官方免费下载地址&#xff1a; Releases BtbN/FFmpeg-Builds GitHub 2. 无需安装&#xff0c;解压缩之后即可使用。这时需要使用windows的cmd运行命令行来进行转码: 先定位到bin文件夹下面&#xff1a; cd C:…

数据处理及评分成果

文章目录 test.py界面展示 pf.pyfpga.py test.py import subprocess import os from PySide2.QtWidgets import QApplication, QMainWindow, QPushButton, QPlainTextEdit, QWidget, QLabel import mysql.connector from PySide2.QtGui import QPixmap, QPalette, QColorconn …

C语言学习准备-编辑器选择

今天继续给大家更新C语言经典案例 今天的案例会比昨天稍微有一些难度&#xff0c;但是同时还是非常经典的案例 本来是想给大家继续更新C语言经典案例&#xff0c;但是有朋友反应C语言编辑器的选择&#xff0c;刚好我自己也是想更换一下C语言的编辑器&#xff0c;跟大家分享一下…

php 小程序生成海报,微信小程序生成海报

vivo x9 微信版本7.0.4 系统版本2.6.2 var memberTopicCount this.data.memberTopicCount;//动态数 var memberFollowCount this.data.memberFollowCount;//关注数 var memberBeFollowedCount this.data.memberBeFollowedCount;//粉丝数 var memberNickName this.data.m…

android 相机自动识别,Android: Camera相机开发详解(下) —— 实现人脸检测功能

android.jpg 前言 如果有小伙伴对于Camera相关的知识还不太了解的话,建议先去看这篇文章《Android: Camera相机开发详解(上) —— 知识储备》 本篇文章是在上篇文章的基础之上,在预览的时候加入人脸检测功能,并自定义一个view显示在预览画面上 实现思路 在相机开始预览后,调…

全屏视频项目

移动端全屏视频 尺寸选择(竖屏) 建议选择7501334&#xff0c; 或者6401136&#xff08;根据设计稿宽度选择&#xff09;&#xff0c;视频尺寸比例根据iphone678屏幕比例 最好使用7501334&#xff0c; 或者6401136&#xff08;但仍不完美&#xff0c;iphoneX等机型会出现上下…

iphone11屏比例_5英寸到6英寸 你以为手机屏幕变大很多?其实是比例变了

最近受疫情影响&#xff0c;手机的发布会都转战线上。黄金三月&#xff0c;在本月有不少手机正式发布&#xff0c;一度成为科技迷的狂欢。而在本月发布的手机中&#xff0c;屏幕尺寸大多都在6英寸以上&#xff0c;让不明所以的吃瓜群众感叹&#xff1a;怎么又是大屏手机&#x…

Android之Camera1实现相机开发

一、前言 现在很多app都会有拍照功能&#xff0c;一般调用系统进行拍照裁剪就能满足平时的需求&#xff0c;但有些场景或者特殊情况下如&#xff1a;持续不间断拍多张照片或者是进行人脸识别的时候&#xff0c;这时候之间调用系统原生相机拍照时不能满足自己的开发需求&#x…

图像和流媒体 -- 详解YUV数据格式

如需转载请注明出处&#xff1a;https://blog.csdn.net/qq_29350001/article/details/78283369 我们在讲 FFmpeg 系列的时候&#xff0c;有提到 YUV 的。其中包括YUV播放器、简单的YUV格式介绍。 参看&#xff1a;FFmpeg再学习 -- 视音频基础知识 接下来详细研究一下&#x…

全面屏成行业标配,vivo副总透露将推完成度更高产品

近日&#xff0c;vivo高级副总裁倪旭东透露&#xff0c;vivo即将推出“完成度”更高的全面屏手机产品。vivo这一举动标志着手机行业全面屏产品和技术的布局又增强劲力量。从vivo以往新品对技术创新和用户体验的把控上来看&#xff0c;vivo的全面屏手机将给用户带来非常大的预期…

怒怼七夕甜言蜜语,vivo“引发”情侣和单身狗的对战

还有不到一周的时间&#xff0c;七夕情人节就要到来了&#xff0c;不知道各对情侣们都准备好礼物了呢&#xff1f;七夕是现在年轻人所非常热衷且重视的一个节日&#xff0c;不仅是恋人们的狂欢日&#xff0c;同样也是单身汉们的吐槽大日子&#xff0c;用励志而又霸气的语句来为…