Skip to main content

python for office

Project description

github star gitee star

search4file

pip install search4file

你好,我是Python程序员晚枫。这个库实现的功能:根据文件内容,搜索文件位置。

已经集成到python-office里了👉视频教程 开发者微信:CoderWanFeng

功能

  • 通过内容查找文件
  • 通过名称查找图片
  • ocr识别图片内容
  • 通过字幕、画面查找视频

To List

有3类并行推进的任务:

1、查找逻辑

3个按照内容查找的接口,需要实现

接口传送门 负责开发:@yinzeyuan

    def search_pdf_file(self, file_path, search_content):
        pass

    def search_ppt_file(self, file_path, search_content):
        pass

    def search_excel_file(self, file_path, search_content):
        pass

1个按照文件名查找的接口,需要实现

接口传送门 负责开发:@yinzeyuan

class SearchByName():

    # 搜索文件名的逻辑
    def search_files(self, search_path, search_content):
        pass

2、优化逻辑

优化内容,目前主要有:

  1. 目前的word查找基于python-docx库,而这个库不支持mac、linux库。
    • 考虑改为解压docx的方式,对解压后的文件进行查找。
  2. 目前对文件的查找,采用单线程同步遍历的方式,速度太慢。
    • 考虑改为进程 + 协程的异步方式,提高查询效率。
  3. 增加OCR自动根据指定的图片内容,进行图片搜索。
    • 例如:用户输入:河流,查找出电脑里所有和河流有关的图片
  4. 识别出视频里的内容。
    • 例如:用户输入:大山,查找出某个视频里,所有和大山有关的画面、字幕

3、交流群

CoderWanFeng

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

search4file-0.1.15.tar.gz (15.9 kB view hashes)

Uploaded Source

Built Distribution

search4file-0.1.15-py3-none-any.whl (16.1 kB view hashes)

Uploaded Python 3

Supported by

AWS AWS Cloud computing and Security Sponsor Datadog Datadog Monitoring Fastly Fastly CDN Google Google Download Analytics Microsoft Microsoft PSF Sponsor Pingdom Pingdom Monitoring Sentry Sentry Error logging StatusPage StatusPage Status page