• Python使用pytesseract库进行文字识别

    pytesseract是Python的一个OCR文本识别库。

    以下几点概括了它的主要信息:

    • 基于Tesseract OCR引擎:pytesseract是Tesseract OCR引擎的Python接口,需要先安装Tesseract。
    • 支持多种语言:通过Tesseract训练好的语言数据,pytesseract支持英文、中文等多种语言的OCR识别。
    • 主要功能:主要提供 image_to_string等方法,将图像文件识别为文本内容。
    • 准确率:基于深度学习的Tesseract 4.0+,识别准确率可以达到96%以上。
    • 使用简单:只需要几行代码就可以实现OCR识别,非常易于上手。
    • 识别流程:加载图像-> 预处理(提高识别质量) -> OCR识别 -> 后处理文本
    • 适用场景:printed文本识别、 invoices识别、身份证/护照识别等。
    • 优势:开源、使用简单、支持多语言、支持训练自定义模型。
    • 劣势:对手写体识别效果较差,对图像质量要求较高。
    • 备选方案:EasyOCR、PaddleOCR等其他OCR库。

    Github项目地址:https://github.com/tesseract-ocr/tesseract

  • Python使用Easyocr库进行文字识别

    EasyOCR是一个开源的Python库,用于进行光学字符识别(OCR)。

    它的主要特点包括:

    • 简单易用:只需要几行代码就可以实现OCR,非常容易上手。
    • 支持多种语言:英语、中文、日语等80多种语言都支持。
    • 准确率高:基于深度学习的算法,识别准确率高。
    • 训练自定义模型:支持使用自己的数据集训练自定义OCR模型。
    • 支持检测方向:可以自动检测图像文字方向。
    • 支持多语言混合:可以处理多国语言混合的图像。
    • 基于PyTorch:建立在PyTorch深度学习框架之上。

    由于易用性强、准确率高等优,EasyOCR非常适合用于快速实现OCR功能,或者作为OCR项目的基础库。它可以广泛应用于票据识别、车牌识别、身份证识别等领域。

    Github项目地址:https://github.com/JaidedAI/EasyOCR

  • Linux 校准系统时间方法

    手上的行空板里的Linux(Debian)系统中,系统时间不对,所以看一下怎么校准方便。

    校正Linux系统时间有多种方法,可以通过手动设置时间、使用NTP服务器同步时间等方式来实现。

  • 为 Docker 创建的 Nginx 容器配置二级域名

    Docker中用 Nginx 镜像可以创建多个网站。

    假设用Nginx镜像创建了容器1:

    用Nginx镜像创建了容器2:

    • 容器名称:ai_html_index
    • 访问地址:http://ip:9080(或者 http://域名:9080 )
    • 网站目录:nginx-index(内含index.html)

    那容器1可以通过域名直接访问,想把容器2的访问设置一个二级域名的操作步骤如下。

  • Python 写接口时编码问题

    想写个简单的接口,有了api2d的key(就像有了openai的key一样),可以调用API了,就简单写个接口当服务器用。

    用的Web框架是Bottle,跟Flask用法一样,也是路由、视图那一套。只是简单的一个聊天接口,所以就用了这个更微型的。
    用法:Python Bottle框架使用举例

    写好接口,用 Requests 进行测试时发现,编码有问题,响应的结果老是乱码。

    Python Requests 使用举例
  • Python Requests 使用举例

    在Python中,Requests 是一个非常常用的第三方库,用于发送HTTP请求。它提供了简洁而直观的API,使得发送HTTP请求变得非常容易。requests库可以用于发送GET、POST、PUT、DELETE等各种类型的请求,并且支持处理Cookie、Session、文件上传等功能。

    官方文档:https://requests.readthedocs.io/en/latest/

  • Python Bottle框架使用举例

    想写个简单的Get请求和Post请求的接口,因为功能上都很简单,所以想找个小型的Web框架,原来一直用的Flask,然后看到了Bottle。

    Bottle 是一个简单而快速的微型Web框架,它只有一个文件,没有外部依赖。适合小型项目和快速原型开发,也可以用于构建API和微服务。适合初学者和小型项目使用。

    官方文档原文:

    Bottle is a fast, simple and lightweight WSGI micro web-framework for Python. It is distributed as a single file module and has no dependencies other than the Python Standard Library.

    Bottle是一个快速、简单、轻量级的WSGI微Web框架,适用于Python。它是作为单个文件模块分发的,除了Python标准库之外没有其他依赖项。

    官方文档:https://bottlepy.org/docs/dev/

  • ChatGPT提示词【笔记】

    看了DeepLearning.ai 联合 OpenAI 推出《面向开发者的 ChatGPT 提示工程》教程。
    讲师是 DeepLearning 创始人吴恩达以及 OpenAI 开发者 Isa Fulford。

    B站有视频加了中文字幕:ChatGPT 提示工程教程

    然后又看了【方糖GPT课】(付费课程)中对于上面教程中提示词的举例。

    就顺便记一下笔记。

  • VSCode配置C++运行环境

    为什么要在VS Code里配置C++编译的环境呢?因为原来用的VS Code写Python,就是用习惯了,感觉VS Code的UI升级后很好看,反正用着各种舒服。

    而且,运行C++也不用来开发什么项目,只是方便测试一点简单的代码,所以对我来说,就够用了。

    VS Code官方也有配置的教程:https://code.visualstudio.com/docs/cpp/config-mingw

  • Python Flask使用正则 模糊查询手机号

    Flask写了个页面,用来查询数据库中的手机号对应的信息。

    我想查询的就两种情况。

    • 精确查询
    • 模糊查询(分两种,号码不全和带*号的)