From 1226e2d70a6bea2996d65fab5a5ae278919a7ba0 Mon Sep 17 00:00:00 2001 From: bigbrother666 Date: Tue, 16 Apr 2024 14:42:54 +0800 Subject: [PATCH] update manuel --- client/README.md | 6 +++++- 1 file changed, 5 insertions(+), 1 deletion(-) diff --git a/client/README.md b/client/README.md index c66dead..18e2dd2 100644 --- a/client/README.md +++ b/client/README.md @@ -23,12 +23,16 @@ - bad_samples 规避的线索描述模式 - report_type 报告类型 -- 【sites] 大类下面列出你的信源。一行一个网址。 +### 4、编辑 sites.txt 文件 + +这个文件指定了需要本地执行的监控的信源,一行一个网址,支持随时更改,每次执行任务前会读取最新的。 如果你只爬取配置了专有爬虫的信源的话,可以直接编辑scrapers/__init__.py 中的scraper_map,这里都留空就好 专有爬虫的说明见 backend/scrapers/README.md +**注:虽然wiseflow client配置了通用爬虫,对于新闻类静态网页有一定的爬取和解析效果,但我们还是强烈建议使用我们的数据订阅服务或者自写专业爬虫。** + ## 参考:各服务注册地址 - 阿里灵积大模型接口:https://dashscope.aliyun.com/