跳到主要内容

MarkDown的解析

RAG 和 向量数据库有了后,还要创建 markdown 的解析器,读取里面的内容然后放入到向量数据库中

@Bean
public MarkdownLoader markdownLoader(ResourcePatternResolver resourcePatternResolver){
return new MarkdownLoader(resourcePatternResolver);
}

MarkdownLoader

@AllArgsConstructor
@Slf4j
public class MarkdownLoader {

private final ResourcePatternResolver resourcePatternResolver;

/**
* 加载 Markdown 文档
*/
public List<Document> loadMarkdowns() {
List<Document> allDocuments = new ArrayList<>();
try {
Resource[] resources = resourcePatternResolver.getResources("classpath:datum/*.md");
log.info("找到 {} 个Markdown文件", resources.length);
for (Resource resource : resources) {
String fileName = resource.getFilename();
log.info("正在处理文件: {}", fileName);

String label = fileName;
if (StringUtil.isNotEmpty(fileName)) {
final String[] parts = fileName.split("-");
if (parts.length > 1) {
label = parts[0];
}
}
log.info("提取的文档标签: {}", label);

Builder builder = MarkdownDocumentReaderConfig.builder()
.withHorizontalRuleCreateDocument(true)
.withIncludeCodeBlock(false)
.withIncludeBlockquote(false);
if (StringUtil.isNotEmpty(fileName)) {
builder.withAdditionalMetadata("name", fileName);
}
if (StringUtil.isNotEmpty(label)) {
builder.withAdditionalMetadata("label", label);
}
MarkdownDocumentReaderConfig config = builder.build();
MarkdownDocumentReader markdownDocumentReader = new MarkdownDocumentReader(resource, config);
List<Document> documents = markdownDocumentReader.get();
log.info("文件 {} 加载了 {} 个文档片段", fileName, documents.size());
allDocuments.addAll(documents);
}
log.info("总共加载了 {} 个文档片段", allDocuments.size());
} catch (IOException e) {
log.error("Markdown 文档加载失败", e);
}
return allDocuments;
}
}

付费内容提示

该文档的全部内容仅对「JavaUp项目实战&技术讲解」知识星球用户开放

加入星球后,你可以获得:

  • 超级八股文:100万+字的全栈技术知识库,涵盖技术核心、数据库、中间件、分布式等深度剖析的讲解
  • 讲解文档:黑马点评Plus、大麦、大麦pro、大麦AI、流量切换、数据中台的从0到1的550+详细文档
  • 讲解视频:黑马点评Plus、大麦、大麦pro、大麦AI、流量切换、数据中台的核心业务详细讲解
  • 1 对 1 解答:可以对我进行1对1的问题提问,而不仅仅只限于项目
  • 针对性服务:有没理解的地方,文档或者视频还没有讲到可以提出,本人会补充
  • 面试与简历指导:提供面试回答技巧,项目怎样写才能在简历中具有独特的亮点
  • 中间件环境:对于项目中需要使用的中间件,可直接替换成我提供的云环境
  • 面试后复盘:小伙伴去面试后,如果哪里被面试官问住了,可以再找我解答
  • 远程的解决:如果在启动项目遇到问题,本人可以帮你远程解决
进入星球后,即可享受上述所有服务,保证不会再有其他隐藏费用。
知识星球二维码

1. 打开微信 -> 扫描左侧二维码 -> 加入「JavaUp项目实战&技术讲解」知识星球

2. 查看星球使用指导,获取完整项目讲解资料索引

👉 点击解锁全部付费内容
🎁优惠