Marker:强大的开源文档转换工具
最近项目里遇到了一些解析层面上的问题,主要是输入的文本如何高效解析出好的内容,刚开始用的是 markitdown,最近微软新开源的一个项目,但是遇到了一个很明显的问题就是把内容切的很碎,导致几乎无法使用了,后来又找了几个 MinerU,但是效果还是不行,后来又继续找,找到了这个项目,感觉效果还不错,所以分享一下。 ...
最近项目里遇到了一些解析层面上的问题,主要是输入的文本如何高效解析出好的内容,刚开始用的是 markitdown,最近微软新开源的一个项目,但是遇到了一个很明显的问题就是把内容切的很碎,导致几乎无法使用了,后来又找了几个 MinerU,但是效果还是不行,后来又继续找,找到了这个项目,感觉效果还不错,所以分享一下。 ...