diff --git a/.gitignore b/.gitignore
index 0ca3b9f..dd42108 100644
--- a/.gitignore
+++ b/.gitignore
@@ -8,5 +8,5 @@ __pycache__
.venv/
pb/pb_data/
pb/pocketbase
-/work_dir/
-/docker_dir/
\ No newline at end of file
+core/docker_dir/
+core/work_dir/
\ No newline at end of file
diff --git a/CHANGELOG.md b/CHANGELOG.md
index 49308d5..e829d42 100644
--- a/CHANGELOG.md
+++ b/CHANGELOG.md
@@ -1,3 +1,8 @@
+# V0.3.6
+- 引入视觉大模型,大幅提升页面获取能力;
+
+- 改进 pocketbase 的前期下载以及用户名密码配置方案,感谢 @ourines 贡献了 install_pocketbase.sh 脚本;
+
# V0.3.5
- 引入 Crawlee(playwrigt模块),大幅提升通用爬取能力,适配实际项目场景;
diff --git a/Dockerfile b/Dockerfile
deleted file mode 100644
index 6bc63dd..0000000
--- a/Dockerfile
+++ /dev/null
@@ -1,22 +0,0 @@
-FROM python:3.10-slim
-
-RUN apt-get update && \
- apt-get install -y tzdata build-essential unzip
-
-COPY core/requirements.txt /tmp/requirements.txt
-RUN pip install --no-cache-dir -r /tmp/requirements.txt
-RUN playwright install
-RUN playwright install-deps
-WORKDIR /app
-
-# download and unzip PocketBase
-ADD https://github.com/pocketbase/pocketbase/releases/download/v0.23.4/pocketbase_0.23.4_linux_amd64.zip /tmp/pb.zip
-# for arm device
-# ADD https://github.com/pocketbase/pocketbase/releases/download/v0.23.4/pocketbase_0.23.4_linux_arm64.zip /tmp/pb.zip
-RUN unzip /tmp/pb.zip -d /pb/
-RUN apt-get clean && rm -rf /var/lib/apt/lists/*
-
-EXPOSE 8090
-# EXPOSE 8077
-
-CMD tail -f /dev/null
\ No newline at end of file
diff --git a/README.md b/README.md
index 6ff4a7f..1854980 100644
--- a/README.md
+++ b/README.md
@@ -10,21 +10,30 @@
https://github.com/user-attachments/assets/f6fec29f-2b4b-40f8-8676-8433abb086a7
-## 🔥 隆重介绍 V0.3.5 版本
+## 🔥 隆重介绍 V0.3.6 版本
-在充分听取社区反馈意见基础之上,我们重新提炼了 wiseflow 的产品定位,新定位更加聚焦,V0.3.5版本即是该定位下的全新架构版本:
+v0.3.6版本已经发布,新增使用视觉大模型作为主模型,大幅提升页面获取能力。
+
+使用视觉大模型通过分析页面截屏信息提取效果 vs 使用文本大模型通过分析页面文本信息提取效果:
+
+![image](https://github.com/user-attachments/assets/f6fec29f-2b4b-40f8-8676-8433abb086a7)
+
+同时本版本改进了 pocketbase 的前期下载以及用户名密码配置方案,感谢 @ourines 贡献了 install_pocketbase.sh 脚本。
+
+(docker运行方案被暂时移除了,感觉大家用起来也不是很方便……)
-- 引入 [Crawlee](https://github.com/apify/crawlee-python) 作为基础爬虫和任务管理框架,大幅提升页面获取能力。实测之前获取不到(包括获取为乱码的)页面目前都可以很好的获取了,后续大家碰到不能很好获取的页面,欢迎在 [issue #136](https://github.com/TeamWiseFlow/wiseflow/issues/136) 中进行反馈;
-- 新产品定位下全新的信息提取策略——“爬查一体”,放弃文章详细提取,爬取过程中即使用 llm 直接提取用户感兴趣的信息(infos),同时自动判断值得跟进爬取的链接,**你关注的才是你需要的**;
-- 适配最新版本(v0.23.4)的 Pocketbase,同时更新表单配置。另外新架构已经无需 GNE 等模块,requirement 依赖项目降低到8个;
-- 新架构部署方案也更加简便,docker 模式支持代码仓热更新,这意味着后续升级就无需再重复docker build了。
- 更多细节,参考 [CHANGELOG](CHANGELOG.md)
-🌟 **V0.3.x 后续计划**
+🌟 **V0.3.x 版本介绍**
+
+在充分听取社区反馈意见基础之上,我们重新提炼了 wiseflow 的产品定位,新定位更加聚焦,自V0.3.5版本开始 wiseflow 使用全新的架构,并引入 [Crawlee](https://github.com/apify/crawlee-python) 作为基础爬虫和任务管理框架,大幅提升页面获取能力。后续我们会持续提升wiseflow 的页面获取能力,大家碰到不能很好获取的页面,欢迎在 [issue #136](https://github.com/TeamWiseFlow/wiseflow/issues/136) 中进行反馈;
+
+另外 V0.3.5开始,wiseflow 采用全新的信息提取策略——“爬查一体”,放弃文章详细提取,爬取过程中即使用 llm 直接提取用户感兴趣的信息(infos),同时自动判断值得跟进爬取的链接,**你关注的才是你需要的**;
+
+**V0.3.x 后续计划**
-- 引入 [SeeAct](https://github.com/OSU-NLP-Group/SeeAct) 方案,通过视觉大模型指导复杂页面的操作,如滚动、点击后出现信息等情况(V0.3.6);
- 尝试支持微信公众号免wxbot订阅(V0.3.7);
-- 引入对 RSS 信息源的支持(V0.3.8);
+- 引入对 RSS 信息源的支持(V0.3.8);~
- 尝试引入 LLM 驱动的轻量级知识图谱,帮助用户从 infos 中建立洞察(V0.3.9)。
## ✋ wiseflow 与传统的爬虫工具、AI搜索、知识库(RAG)项目有何不同?
@@ -49,7 +58,20 @@ wiseflow自2024年6月底发布 V0.3.0版本来受到了开源社区的广泛关
git clone https://github.com/TeamWiseFlow/wiseflow.git
```
-### 2. 参考 env_sample 配置 .env 文件放置在 core 目录下
+### 2. 执行根目录下的 install_pocketbase.sh 脚本
+
+该脚本会引导下载并配置 pocketbase(版本选择0.23.4),同时在 core 下创建 .env 文件。
+
+```bash
+chmod +x install_pocketbase.sh
+./install_pocketbase.sh
+```
+
+wiseflow 0.3.x版本使用 pocketbase 作为数据库,你当然也可以手动下载 pocketbase 客户端 (记得下载0.23.4版本,并放入 [pb](./pb) 目录下) 以及手动完成superuser的创建(记得存入.env文件)
+
+具体可以参考 [pb/README.md](/pb/README.md)
+
+### 3. 继续配置 core/.env 文件
🌟 **这里与之前版本不同**,V0.3.5开始需要把 .env 放置在 core文件夹中。
@@ -65,7 +87,7 @@ git clone https://github.com/TeamWiseFlow/wiseflow.git
- PB_API_AUTH="test@example.com|1234567890"
- pocketbase 数据库的 superuser 用户名和密码,记得用 | 分隔
+ pocketbase 数据库的 superuser 用户名和密码,记得用 | 分隔 (如果 install_pocketbase.sh 脚本执行成功,这一项应该已经存在了)
下面的都是可选配置:
- #VERBOSE="true"
@@ -88,65 +110,32 @@ git clone https://github.com/TeamWiseFlow/wiseflow.git
只有当你的 pocketbase 不运行在默认ip 或端口下才需要配置,默认情况下忽略就行。
-### 3.1 使用docker运行
-
-✋ V0.3.5版本架构和依赖与之前版本有较大不同,请务必重新拉取代码,删除旧版本镜像(包括外挂的 pb_data 文件夹),重新build!
-
-对于国内用户,可以先配置镜像源:
-
-最新可用 docker 镜像加速地址参考:[参考1](https://github.com/dongyubin/DockerHub) [参考2](https://www.coderjia.cn/archives/dba3f94c-a021-468a-8ac6-e840f85867ea)
-
-**三方镜像,风险自担。**
-
-之后
-
-```bash
-cd wiseflow
-docker compose up
-```
-
-**注意:**
-
-第一次运行docker container时程序可能会报错,这是正常现象,请按屏幕提示创建 super user 账号(一定要使用邮箱),然后将创建的用户名密码填入.env文件,重启container即可。
-
-🌟 docker方案默认运行 task.py ,即会周期性执行爬取-提取任务(启动时会立即先执行一次,之后每隔一小时启动一次)
-
-### 3.2 使用python环境运行
+### 4. 使用python环境运行
✋ V0.3.5版本架构和依赖与之前版本有较大不同,请务必重新拉取代码,删除(或重建)pb_data
-推荐使用 conda 构建虚拟环境
+推荐使用 conda 构建虚拟环境(当然你也可以忽略这一步,或者使用其他 python 虚拟环境方案)
+
+```bash
+conda create -n wiseflow python=3.10
+conda activate wiseflow
+```
+
+之后运行
```bash
cd wiseflow
-conda create -n wiseflow python=3.10
-conda activate wiseflow
cd core
pip install -r requirements.txt
-```
-
-之后去这里 [下载](https://pocketbase.io/docs/) 对应的 pocketbase 客户端,放置到 [/pb](/pb) 目录下。
-> ⚠️ 或者执行根目录下的 install_pocketbase.sh 脚本,会自动下载并配置 pocketbase。
-> ```bash
-> chmod +x install_pocketbase.sh
-> ./install_pocketbase.sh
-> ```
-
-
-然后
-
-```bash
chmod +x run.sh
./run_task.sh # if you just want to scan sites one-time (no loop), use ./run.sh
```
-这个脚本会自动判断 pocketbase 是否已经在运行,如果未运行,会自动拉起。但是请注意,当你 ctrl+c 或者 ctrl+z 终止进程时,pocketbase 进程不会被终止,直到你关闭terminal。
+🌟 这个脚本会自动判断 pocketbase 是否已经在运行,如果未运行,会自动拉起。但是请注意,当你 ctrl+c 或者 ctrl+z 终止进程时,pocketbase 进程不会被终止,直到你关闭terminal。
-另外与 docker 部署一样,第一次运行时可能会出现报错,请按屏幕提示创建 super user 账号(一定要使用邮箱),然后将创建的用户名密码填入.env文件,再次运行即可。
+run_task.sh 会周期性执行爬取-提取任务(启动时会立即先执行一次,之后每隔一小时启动一次), 如果仅需执行一次,可以使用 run.sh 脚本。
-当然你也可以在另一个 terminal 提前运行并设定 pocketbase(这会避免第一次的报错),具体可以参考 [pb/README.md](/pb/README.md)
-
-### 4. 模型推荐 [2024-12-09]
+### 5. 模型推荐 [2024-12-09]
虽然参数量越大的模型意味着更佳的性能,但经过实测,**使用 Qwen2.5-7b-Instruct 和 glm-4-9b-chat 模型,即可以达到基本的效果**。不过综合考虑成本、速度和效果,我更加推荐主模型
**(PRIMARY_MODEL)使用Qwen2.5-14B-Instruct**。
@@ -164,11 +153,11 @@ chmod +x run.sh
🌟 **请注意 wiseflow 本身并不限定任何模型服务,只要服务兼容 openAI SDK 即可,包括本地部署的 ollama、Xinference 等服务**
-### 5. **关注点和定时扫描信源添加**
+### 6. **关注点和定时扫描信源添加**
启动程序后,打开pocketbase Admin dashboard UI (http://127.0.0.1:8090/_/)
-#### 5.1 打开 focus_point 表单
+#### 6.1 打开 focus_point 表单
通过这个表单可以指定你的关注点,LLM会按此提炼、过滤并分类信息。
@@ -179,7 +168,7 @@ chmod +x run.sh
注意:focus_point 更新设定(包括 activated 调整)后,**需要重启程序才会生效。**
-#### 5.2 打开 sites表单
+#### 6.2 打开 sites表单
通过这个表单可以指定自定义信源,系统会启动后台定时任务,在本地执行信源扫描、解析和分析。
@@ -225,9 +214,8 @@ PocketBase作为流行的轻量级数据库,目前已有 Go/Javascript/Python
- crawlee-python (A web scraping and browser automation library for Python to build reliable crawlers. Works with BeautifulSoup, Playwright, and raw HTTP. Both headful and headless mode. With proxy rotation.) https://github.com/apify/crawlee-python
- json_repair(Repair invalid JSON documents ) https://github.com/josdejong/jsonrepair/tree/main
- python-pocketbase (pocketBase client SDK for python) https://github.com/vaphes/pocketbase
-- SeeAct(a system for generalist web agents that autonomously carry out tasks on any given website, with a focus on large multimodal models (LMMs) such as GPT-4Vision.) https://github.com/OSU-NLP-Group/SeeAct
-同时受 [GNE](https://github.com/GeneralNewsExtractor/GeneralNewsExtractor)、[AutoCrawler](https://github.com/kingname/AutoCrawler) 启发。
+本项目开发受 [GNE](https://github.com/GeneralNewsExtractor/GeneralNewsExtractor)、[AutoCrawler](https://github.com/kingname/AutoCrawler) 、[SeeAct](https://github.com/OSU-NLP-Group/SeeAct) 启发。
## Citation
diff --git a/compose.yaml b/compose.yaml
deleted file mode 100755
index 09033f6..0000000
--- a/compose.yaml
+++ /dev/null
@@ -1,14 +0,0 @@
-services:
- core:
- build:
- dockerfile: Dockerfile
- image: wiseflow:latest
- tty: true
- stdin_open: true
- entrypoint: ["bash", "/app/docker_entrypoint.sh"]
- ports:
- - 8090:8090
- volumes:
- - ./core:/app
- - ./pb/pb_data:/pb/pb_data
- - ./pb/pb_migrations:/pb/pb_migrations
\ No newline at end of file
diff --git a/core/agents/get_info.py b/core/agents/get_info.py
index 5922bc4..609d6b7 100644
--- a/core/agents/get_info.py
+++ b/core/agents/get_info.py
@@ -14,7 +14,7 @@ class GeneralInfoExtractor:
self.pb = pb
self.logger = _logger
self.model = os.environ.get("PRIMARY_MODEL", "Qwen/Qwen2.5-7B-Instruct") # better to use "Qwen/Qwen2.5-14B-Instruct"
- self.secondary_model = os.environ.get("SECONDARY_MODEL", "THUDM/glm-4-9b-chat")
+ self.secondary_model = os.environ.get("SECONDARY_MODEL", 'Qwen/Qwen2.5-7B-Instruct') # better to use ''
# collect tags user set in pb database and determin the system prompt language based on tags
focus_data = pb.read(collection_name='focus_points', filter=f'activated=True')
@@ -45,7 +45,6 @@ class GeneralInfoExtractor:
- 理解每个兴趣点的含义,确保提取的内容与之相关。
- 如果兴趣点有进一步的解释,确保提取的内容符合这些解释的范围。
- 忠于原文,你的任务是从网页文本中识别和提取与各个兴趣点相关的信息,并不是总结和提炼。
-- 不管给定的原文是何种语言,请保证使用中文输出你的提取结果。
另外请注意给定的网页文本是通过爬虫程序从html代码中提取出来的,所以请忽略里面不必要的空格、换行符等。'''
self.get_info_suffix = '''如果上述网页文本中包含兴趣点相关的内容,请按照以下json格式输出提取的信息(文本中可能包含多条有用信息,请不要遗漏):
@@ -118,6 +117,7 @@ url2
return result['source'], extract_and_convert_dates(result['publish_date'])
async def get_more_related_urls(self, link_dict: dict, og_url: str) -> set[str]:
+ """
if not link_dict:
return set()
self.logger.debug(f'{len(link_dict)} items to analyze')
@@ -130,7 +130,7 @@ url2
{'role': 'user', 'content': f'{content}\n{self.get_more_link_suffix}'}],
model=self.model, temperature=0.1)
self.logger.debug(f'get_more_related_urls llm output:\n{result}')
- result = re.findall(r'"""(.*?)"""', result, re.DOTALL)
+ result = re.findall(r'\"\"\"(.*?)\"\"\"', result, re.DOTALL)
if result:
result = result[0].strip()
# self.logger.debug(f"cleaned output: {result}")
@@ -142,7 +142,7 @@ url2
{'role': 'user', 'content': f'{content}\n{self.get_more_link_suffix}'}],
model=self.model, temperature=0.1)
self.logger.debug(f'get_more_related_urls llm output:\n{result}')
- result = re.findall(r'"""(.*?)"""', result, re.DOTALL)
+ result = re.findall(r'\"\"\"(.*?)\"\"\"', result, re.DOTALL)
if result:
result = result[0].strip()
# self.logger.debug(f"cleaned output: {result}")
@@ -154,7 +154,9 @@ url2
if hallucination_urls:
self.logger.warning(f"{hallucination_urls} not in link_dict, it's model's Hallucination")
- return urls & raw_urls
+ return urls & raw_urls
+ """
+ return set()
async def get_info(self, text: str, info_pre_fix: str, link_dict: dict) -> list[dict]:
if not text:
diff --git a/core/general_process.py b/core/general_process.py
index da6931a..46c825e 100644
--- a/core/general_process.py
+++ b/core/general_process.py
@@ -40,9 +40,8 @@ async def save_to_pb(url: str, infos: list):
crawler = PlaywrightCrawler(
# Limit the crawl to max requests. Remove or increase it for crawling all links.
# max_requests_per_crawl=1,
- max_request_retries=2,
+ max_request_retries=1,
request_handler_timeout=timedelta(minutes=5),
- headless=False if os.environ.get("VERBOSE", "").lower() in ["true", "1"] else True
)
@crawler.pre_navigation_hook
diff --git a/install_pocketbase.sh b/install_pocketbase.sh
index bc716e1..d8628b9 100755
--- a/install_pocketbase.sh
+++ b/install_pocketbase.sh
@@ -225,7 +225,7 @@ configure_admin() {
configure_env() {
# Create .env if it doesn't exist
if [ ! -f "./core/.env" ]; then
- mkdir -p ./core
+ # mkdir -p ./core
cp env_sample ./core/.env
echo "Created new .env file from template"
else
diff --git a/test/README.md b/test/README.md
new file mode 100644
index 0000000..c9ee143
--- /dev/null
+++ b/test/README.md
@@ -0,0 +1 @@
+![alt text](image.png)
\ No newline at end of file
diff --git a/test/fetching_for_sample.py b/test/fetching_for_sample.py
new file mode 100644
index 0000000..71442ae
--- /dev/null
+++ b/test/fetching_for_sample.py
@@ -0,0 +1,106 @@
+# -*- coding: utf-8 -*-
+from bs4 import BeautifulSoup
+import os
+import json
+import asyncio
+from urllib.parse import urlparse, urljoin
+import hashlib
+from crawlee.playwright_crawler import PlaywrightCrawler, PlaywrightCrawlingContext, PlaywrightPreNavigationContext
+from datetime import timedelta
+
+
+sites = ["https://cryptopanic.com/news/"]
+
+
+os.environ['CRAWLEE_STORAGE_DIR'] = 'test/webpage_samples/crawlee_storage'
+save_dir = 'webpage_samples'
+
+async def main(sites: list):
+ crawler = PlaywrightCrawler(
+ # Limit the crawl to max requests. Remove or increase it for crawling all links.
+ # max_requests_per_crawl=1,
+ max_request_retries=1,
+ request_handler_timeout=timedelta(minutes=5)
+ )
+
+ @crawler.pre_navigation_hook
+ async def log_navigation_url(context: PlaywrightPreNavigationContext) -> None:
+ context.log.info(f'navigeting {context.request.url} ...')
+
+ @crawler.router.default_handler
+ async def request_handler(context: PlaywrightCrawlingContext) -> None:
+ # context.log.info(f'Processing {context.request.url} ...')
+ # Handle dialogs (alerts, confirms, prompts)
+ await context.page.wait_for_load_state('networkidle')
+ await context.page.wait_for_timeout(2000)
+
+ async def handle_dialog(dialog):
+ context.log.info(f'Closing dialog: {dialog.message}')
+ await dialog.accept()
+ context.page.on('dialog', handle_dialog)
+
+ # 尝试查找并点击 "Accept" 按钮
+ button_texts = ['Accept', 'Allow', 'Close']
+ button_selectors = ['.close-btn', '.accept-button', '.allow-button']
+
+ # 等待弹窗出现并尝试关闭
+ for text in button_texts:
+ try:
+ context.log.info(f'等待按钮: {text} 可见...')
+ await context.page.wait_for_selector(f'button:text("{text}")', state='visible', timeout=5000) # 等待最多5秒
+ await context.page.locator(f'button:text("{text}")').click()
+ context.log.info(f'点击按钮: {text}')
+ await context.page.wait_for_timeout(1000)
+ except Exception as e:
+ context.log.error(f'未能点击按钮: {text},错误: {e}')
+
+ for selector in button_selectors:
+ try:
+ context.log.info(f'等待选择器: {selector} 可见...')
+ await context.page.wait_for_selector(selector, state='visible', timeout=5000) # 等待最多5秒
+ await context.page.locator(selector).click()
+ context.log.info(f'点击选择器: {selector}')
+ await context.page.wait_for_timeout(1000)
+ except Exception as e:
+ context.log.error(f'未能点击选择器: {selector},错误: {e}')
+
+ folder = os.path.join(save_dir, f"{hashlib.sha256(context.request.url.encode()).hexdigest()[-6:]}")
+ os.makedirs(folder, exist_ok=True)
+ html = await context.page.inner_html('body')
+ context.log.info('successfully finish fetching')
+ existing_urls = set()
+ parsed_url = urlparse(context.request.url)
+ domain = parsed_url.netloc
+ text = await context.page.inner_text('body')
+ with open(os.path.join(folder, 'text.txt'), 'w') as f:
+ f.write(text)
+
+ soup = BeautifulSoup(html, 'html.parser')
+ links = soup.find_all('a', href=True)
+ base_url = f"{parsed_url.scheme}://{domain}"
+ link_dict = {}
+ for a in links:
+ new_url = a.get('href')
+ if new_url.startswith('javascript:') or new_url.startswith('#') or new_url.startswith('mailto:'):
+ continue
+ if new_url in [context.request.url, base_url]:
+ continue
+ if new_url in existing_urls:
+ continue
+ t = a.text.strip()
+ if new_url and t:
+ link_dict[t] = urljoin(base_url, new_url)
+ existing_urls.add(new_url)
+ with open(os.path.join(folder, 'link_dict.json'), 'w', encoding='utf-8') as f:
+ json.dump(link_dict, f, indent=4, ensure_ascii=False)
+
+ links_number_from_html = len(link_dict)
+ print(f"links number from html: {links_number_from_html}")
+
+ screenshot_file = os.path.join(folder, 'screenshot.jpg')
+ await context.page.screenshot(path=screenshot_file, full_page=True)
+
+ await crawler.run(sites)
+
+if __name__ == '__main__':
+ asyncio.run(main(sites))
diff --git a/test/get_info_test.py b/test/get_info_test.py
new file mode 100644
index 0000000..3423023
--- /dev/null
+++ b/test/get_info_test.py
@@ -0,0 +1,313 @@
+# -*- coding: utf-8 -*-
+
+import os, re
+import json
+import asyncio
+import time, base64
+from info_test_prompts import *
+import json_repair
+from llms.openai_wrapper import openai_llm as llm
+
+
+sample_dir = 'test/webpage_samples'
+models = ['deepseek-ai/DeepSeek-V2.5', 'Qwen/Qwen2.5-Coder-32B-Instruct', 'Qwen/Qwen2.5-32B-Instruct', 'Qwen/Qwen2.5-14B-Instruct', 'Qwen/Qwen2.5-Coder-7B-Instruct']
+vl_models = ['Qwen/Qwen2-VL-72B-Instruct', 'OpenGVLab/InternVL2-26B', 'TeleAI/TeleMM', 'Pro/Qwen/Qwen2-VL-7B-Instruct', 'Pro/OpenGVLab/InternVL2-8B', 'OpenGVLab/InternVL2-Llama3-76B']
+
+async def main(link_dict, text, screenshot_file, record_file, prompts):
+ for model in models:
+ print(f"running {model} ...")
+ start_time = time.time()
+ hallucination_times = 0
+ # got more links from text
+ # more_urls = set()
+ more_url_text = set()
+ content = ''
+ for key in link_dict.keys():
+ content = f"{content}{key}\n"
+ if len(content) > 512:
+ result = await llm([{'role': 'system', 'content': prompts[1]},
+ {'role': 'user', 'content': f'\n{content}\n\n\n{text_link_suffix}'}],
+ model=model, temperature=0.1)
+ print(f"llm output: {result}")
+ result = re.findall(r'"""(.*?)"""', result, re.DOTALL)
+ if result:
+ result = result[0].strip()
+ result = result.split('\n')
+ # more_urls.update({link_dict[t] for t in result if t in link_dict})
+ more_url_text.update({f"{t}: {link_dict[t]}" for t in result if t in link_dict})
+ else:
+ hallucination_times += len(result) - len({t for t in result if t in link_dict})
+ content = ''
+
+ if content:
+ result = await llm([{'role': 'system', 'content': prompts[1]},
+ {'role': 'user', 'content': f'\n{content}\n\n\n{text_link_suffix}'}],
+ model=model, temperature=0.1)
+ print(f"llm output: {result}")
+ result = re.findall(r'"""(.*?)"""', result, re.DOTALL)
+ if result:
+ result = result[0].strip()
+ result = result.split('\n')
+ # more_urls.update({link_dict[t] for t in result if t in link_dict})
+ more_url_text.update({f"{t}: {link_dict[t]}" for t in result if t in link_dict})
+ else:
+ hallucination_times += len(result) - len({t for t in result if t in link_dict})
+
+ more_url_text = '\n'.join(more_url_text)
+ print(f"time spent: {time.time() - start_time}")
+
+ # get infos from text
+ infos = []
+ lines = text.split('\n')
+ cache = ''
+ for line in lines:
+ cache = f'{cache}{line}'
+ if len(cache) > 2048:
+ content = f'\n{cache}\n\n\n{text_info_suffix}'
+ result = await llm(
+ [{'role': 'system', 'content': prompts[0]}, {'role': 'user', 'content': content}],
+ model=model, temperature=0.1, response_format={"type": "json_object"})
+ print(f"llm output: {result}")
+ cache = ''
+ if not result:
+ hallucination_times += 1
+ continue
+ result = json_repair.repair_json(result, return_objects=True)
+ if not isinstance(result, list):
+ hallucination_times += 1
+ continue
+ if not result:
+ hallucination_times += 1
+ continue
+ infos.extend(result)
+
+ if cache:
+ content = f'\n{cache}\n\n\n{text_info_suffix}'
+ result = await llm([{'role': 'system', 'content': prompts[0]}, {'role': 'user', 'content': content}],
+ model=model, temperature=0.1, response_format={"type": "json_object"})
+ print(f"llm output: {result}")
+ if not result:
+ hallucination_times += 1
+ result = json_repair.repair_json(result, return_objects=True)
+ if not isinstance(result, list):
+ hallucination_times += 1
+ if not result:
+ hallucination_times += 1
+ infos.extend(result)
+
+ final_infos = []
+ for item in infos:
+ if 'focus' not in item or 'content' not in item:
+ hallucination_times += 1
+ continue
+ if not item['content']:
+ hallucination_times += 1
+ continue
+ if item['content'] in link_dict:
+ continue
+
+ final_infos.append(f"{item['focus']}: {item['content']}")
+
+ final_infos = '\n'.join(final_infos)
+ print(f"time spent: {time.time() - start_time}")
+
+ # get author and publish date from text
+ if len(text) > 1024:
+ usetext = f'{text[:500]}......{text[-500:]}'
+ else:
+ usetext = text
+ content = f'\n{usetext}\n\n\n{text_ap_suffix}'
+ llm_output = await llm([{'role': 'system', 'content': text_ap_system}, {'role': 'user', 'content': content}],
+ model=model, max_tokens=50, temperature=0.1, response_format={"type": "json_object"})
+ print(f"llm output: {llm_output}")
+ if not llm_output:
+ hallucination_times += 1
+ ap_ = {}
+ else:
+ result = json_repair.repair_json(llm_output, return_objects=True)
+ if not isinstance(result, dict):
+ hallucination_times += 1
+ ap_ = {}
+ else:
+ ap_ = result
+
+ total_analysis_time = time.time() - start_time
+ print(f"text analysis finished, total time used: {total_analysis_time}")
+ print("*" * 12)
+ print('\n\n')
+
+ with open(record_file, 'a') as f:
+ f.write(f"llm model: {model}\n")
+ f.write(f"hallucination times: {hallucination_times}\n")
+ f.write(f"total analysis time: {total_analysis_time}\n\n")
+ f.write(f"author and publish time(not formated): {ap_}\n")
+ f.write(f"infos(not formated): \n{final_infos}\n")
+ f.write(f"more urls: \n{more_url_text}\n\n")
+ f.write("*" * 12)
+ f.write('\n\n')
+
+
+if __name__ == '__main__':
+ dirs = os.listdir(sample_dir)
+ for _dir in dirs:
+ if not _dir.startswith('task'):
+ continue
+ _path = os.path.join(sample_dir, _dir)
+ if not os.path.isdir(_path):
+ continue
+ if not os.path.exists(os.path.join(_path, 'focus_point.json')):
+ print(f'{_dir} focus_point.json not found, skip')
+ continue
+ focus_points = json.load(open(os.path.join(_path, 'focus_point.json'), 'r'))
+ focus_statement = ''
+ for item in focus_points:
+ tag = item["focuspoint"]
+ expl = item["explanation"]
+ focus_statement = f"{focus_statement}#{tag}\n"
+ if expl:
+ focus_statement = f"{focus_statement}解释:{expl}\n"
+
+ print(f'start testing {_dir}')
+ print(f"focus statement: {focus_statement}")
+ get_info_system = text_info_system.replace('{focus_statement}', focus_statement)
+ get_link_system = text_link_system.replace('{focus_statement}', focus_statement)
+ #get_info_system = image_info_system.replace('{focus_statement}', focus_statement)
+ #get_link_system = image_link_system.replace('{focus_statement}', focus_statement)
+ prompts = [get_info_system, get_link_system]
+
+ samples = os.listdir(_path)
+ time_stamp = time.strftime('%Y-%m-%d-%H-%M-%S', time.localtime())
+ record_file = os.path.join(_path, f'record-{time_stamp}.txt')
+ with open(record_file, 'w') as f:
+ f.write(f"focus statement: \n{focus_statement}\n\n")
+ for sample in samples:
+ if not os.path.isdir(os.path.join(_path, sample)):
+ continue
+ files = os.listdir(os.path.join(_path, sample))
+ if 'link_dict.json' not in files or 'text.txt' not in files or 'screenshot.jpg' not in files:
+ print(f'{sample} files not complete, skip')
+ continue
+ link_dict = json.load(open(os.path.join(_path, sample, 'link_dict.json'), 'r'))
+ text = open(os.path.join(_path, sample, 'text.txt'), 'r').read()
+ screenshot_file = os.path.join(_path, sample, 'screenshot.jpg')
+ with open(record_file, 'a') as f:
+ f.write(f"raw materials: {sample}\n\n")
+ asyncio.run(main(link_dict, text, screenshot_file, record_file, prompts))
+"""
+ with open(screenshot_file, "rb") as image_file:
+ base64_image = base64.b64encode(image_file.read()).decode('utf-8')
+ print(f"run {model} testing...")
+ start_time = time.time()
+ hallucination_times = 0
+
+ # get infos from image
+ _infos = []
+ llm_output = await llm([{"role": "system", "content": [{"type": "text", "text": image_info_system}]},
+ {"role": "user", "content": [{"type": "image_url",
+ "image_url": {
+ "url": f"data:image/jpeg;base64,{base64_image}",
+ "detail": "high"}},
+ {"type": "text", "text": image_info_suffix}]}],
+ model=model,
+ temperature=0.1)
+
+ print(f"vl model output: \n{llm_output}")
+ if not llm_output:
+ hallucination_times += 1
+ result = []
+ else:
+ result = json_repair.repair_json(llm_output, return_objects=True)
+ if not isinstance(result, list):
+ hallucination_times += 1
+ result = []
+ if not result:
+ hallucination_times += 1
+ _infos.extend(result)
+
+ final_infos = []
+ for item in _infos:
+ if 'focus' not in item or 'content' not in item:
+ hallucination_times += 1
+ continue
+ if not item['content']:
+ hallucination_times += 1
+ continue
+
+ if item['content'] in link_dict:
+ continue
+
+ judge = await llm([{'role': 'system', 'content': verified_system},
+ {'role': 'user',
+ 'content': f'\n{item["content"]}\n\n\n\n{text}\n\n\n{verified_suffix}'}],
+ model="THUDM/glm-4-9b-chat", temperature=0.1)
+ if not judge:
+ print('scondary model cannot judge')
+ final_infos.append(item)
+ continue
+
+ to_save = False
+ for i in range(min(7, len(judge))):
+ char = judge[-1 - i]
+ if char == '是':
+ to_save = True
+ break
+ elif char == '否':
+ break
+ if not to_save:
+ hallucination_times += 1
+ continue
+ final_infos.append(item)
+
+ print(f"final infos from image: {final_infos}")
+ print(f"image hallucination times: {hallucination_times}")
+ print(f"time used: {time.time() - start_time}")
+
+ # get links from image
+ more_links = set()
+ llm_output = await llm([{"role": "system", "content": [{"type": "text", "text": image_link_system}]},
+ {"role": "user", "content": [{"type": "image_url",
+ "image_url": {
+ "url": f"data:image/jpeg;base64,{base64_image}",
+ "detail": "high"}},
+ {"type": "text", "text": image_link_suffix}]}],
+ model=model,
+ temperature=0.1)
+ print(f"vl model output: \n{llm_output}")
+ result = re.findall(r'\"\"\"(.*?)\"\"\"', llm_output, re.DOTALL)
+ if result:
+ result = result[0].strip()
+ else:
+ hallucination_times += 1
+ result = []
+
+ more_links = [link_dict[_t] for _t in result if _t in link_dict]
+ print(f"more urls by image: {more_links}")
+ print(f"image hallucination times: {hallucination_times}")
+ print(f"time used: {time.time() - start_time}")
+
+ # get author and publish date from image
+ llm_output = await llm([{"role": "system", "content": [{"type": "text", "text": image_ap_system}]},
+ {"role": "user", "content": [{"type": "image_url",
+ "image_url": {
+ "url": f"data:image/jpeg;base64,{base64_image}",
+ "detail": "high"}},
+ {"type": "text", "text": image_ap_suffix}]}],
+ model=model,
+ max_tokens=50, temperature=0.1)
+ print(f"vl model output: \n{llm_output}")
+ if not llm_output:
+ hallucination_times += 1
+ ap = {}
+ else:
+ result = json_repair.repair_json(llm_output, return_objects=True)
+ if not isinstance(result, dict):
+ hallucination_times += 1
+ ap = {}
+ else:
+ ap = result
+
+ print(f"ap from image: {ap}")
+ print(f"image hallucination times: {hallucination_times}")
+ total_analysis_time = time.time() - start_time
+ print(f"image analysis finished, total time used: {total_analysis_time}")
+"""
\ No newline at end of file
diff --git a/test/image.png b/test/image.png
new file mode 100644
index 0000000..8944de6
Binary files /dev/null and b/test/image.png differ
diff --git a/test/info_test_prompts.py b/test/info_test_prompts.py
new file mode 100644
index 0000000..3b67ad0
--- /dev/null
+++ b/test/info_test_prompts.py
@@ -0,0 +1,73 @@
+
+text_info_system = '''作为信息提取助手,你的任务是从给定的网页文本中提取与以下用户兴趣点相关的内容。兴趣点列表及其解释如下:
+
+{focus_statement}\n
+在进行信息提取时,请遵循以下原则:
+
+- 理解每个兴趣点的含义,确保提取的内容与之相关。
+- 如果兴趣点有进一步的解释,确保提取的内容符合这些解释的范围。
+- 忠于原文,你的任务是从网页文本中识别和提取与各个兴趣点相关的信息,并不是总结和提炼。
+
+另外请注意给定的网页文本是通过爬虫程序从html代码中提取出来的,所以请忽略里面不必要的空格、换行符等。'''
+
+text_info_suffix = '''如果上述网页文本中包含兴趣点相关的内容,请按照以下json格式输出提取的信息(文本中可能包含多条有用信息,请不要遗漏):
+[{"focus": 兴趣点名称, "content": 提取的内容}]
+
+示例:
+[{"focus": "旅游景点", "content": "北京故宫,地址:北京市东城区景山前街4号,开放时间:8:30-17:00"}, {"focus": "美食推荐", "content": "来王府井小吃街必吃北京烤鸭、炸酱面"}]
+
+如果网页文本中不包含任何与兴趣点相关的信息,请仅输出:[]。'''
+
+text_link_system = '''作为一位高效的信息筛选助手,你将被给到一组链接对应的文本,请从中挑选出跟兴趣点有关的文本。兴趣点及其解释如下:\n\n{focus_statement}\n
+在进行信息提取时,请遵循以下原则:
+
+- 理解每个兴趣点的含义,确保提取的文本与之相关。
+- 如果兴趣点有进一步的解释,确保提取的文本符合这些解释的范围。'''
+
+text_link_suffix = '''请一步步思考,最终将挑选出的文本按一行一条的格式输出,并整体用三引号包裹,三引号内不要有其他内容,如下是输出格式示例:
+"""
+文本1
+文本2
+...
+"""'''
+
+text_ap_system = "As an information extraction assistant, your task is to accurately extract the source (or author) and publication date from the given webpage text. It is important to adhere to extracting the information directly from the original text. If the original text does not contain a particular piece of information, please replace it with NA"
+text_ap_suffix = '''Please output the extracted information in the following JSON format:
+{"source": source or article author (use "NA" if this information cannot be extracted), "publish_date": extracted publication date (keep only the year, month, and day; use "NA" if this information cannot be extracted)}'''
+
+
+verified_system = '''判断给定的信息是否与网页文本相符。信息将用标签包裹,网页文本则用包裹。请遵循如下工作流程:
+1、尝试找出网页文本中所有与信息对应的文本片段(可能有多处);
+2、基于这些片段给出是否相符的最终结论,最终结论仅为“是”或“否”'''
+verified_suffix = '先输出找到的所有文本片段,再输出最终结论(仅为是或否)'
+
+
+image_info_system = '''作为信息提取助手,你的任务是从给定的网页截屏中提取与以下用户兴趣点相关的内容。兴趣点列表及其解释如下:
+
+{focus_statement}\n
+在进行信息提取时,请遵循以下原则:
+
+- 理解每个兴趣点的含义,确保提取的内容与之相关。
+- 如果兴趣点有进一步的解释,确保提取的内容符合这些解释的范围。
+- 忠于原文,你的任务是从网页截屏中识别和提取与各个兴趣点相关的信息,并不是总结和提炼。'''
+
+image_info_suffix = '''如果网页截屏中包含兴趣点相关的内容,请按照以下json格式输出提取的信息(文本中可能包含多条有用信息,请不要遗漏):
+[{"focus": 兴趣点名称, "content": 提取的内容}]
+
+示例:
+[{"focus": "旅游景点", "content": "北京故宫,地址:北京市东城区景山前街4号,开放时间:8:30-17:00"}, {"focus": "美食推荐", "content": "来王府井小吃街必吃北京烤鸭、炸酱面"}]
+
+如果截屏中不包含任何与兴趣点相关的信息,请仅输出:[]。'''
+
+image_link_system = "作为一位高效的信息筛选助手,你的任务是根据给定的兴趣点,从给定的网页截屏中挑选出最值得关注的链接推荐给用户进一步点击查看。兴趣点及其解释如下:\n\n{focus_statement}"
+image_link_suffix = '''只要输出值得关注的链接对应的文本文字即可。按一行一条的格式输出,最终输出的列表整体用三引号包裹,三引号内不要有其他内容,如下是输出格式示例:
+"""
+链接文字1
+链接文字2
+...
+"""'''
+
+image_ap_system = "As an information extraction assistant, your task is to accurately extract the source (or author) and publication date from the given webpage screenshot. If the screenshot does not contain a particular piece of information, please replace it with NA"
+image_ap_suffix = '''Please output the extracted information in the following JSON format:
+{"source": source or article author (use "NA" if this information cannot be found), "publish_date": publication date (keep only the year, month, and day; use "NA" if this information cannot be found)}'''
+
diff --git a/test/webpage_samples/_task2/29229b/link_dict.json b/test/webpage_samples/_task2/29229b/link_dict.json
new file mode 100644
index 0000000..ec91b9b
--- /dev/null
+++ b/test/webpage_samples/_task2/29229b/link_dict.json
@@ -0,0 +1,123 @@
+{
+ "Log In": "https://www.reddit.com/login/",
+ "Advertise on Reddit": "https://accounts.reddit.com/adsregister?utm_source=web3x_consumer&utm_name=user_menu_cta",
+ "Shop Collectible Avatars": "https://www.reddit.com/avatar/shop",
+ "Feed": "https://www.reddit.com/r/artificial",
+ "About": "https://www.reddit.com/r/artificial/about/",
+ "Hot": "https://www.reddit.com/r/artificial/hot/",
+ "New": "https://www.reddit.com/r/artificial/new/",
+ "Top": "https://www.reddit.com/r/artificial/top/",
+ "Rising": "https://www.reddit.com/r/artificial/rising/",
+ "Card": "https://www.reddit.com?feedViewType=cardView",
+ "Compact": "https://www.reddit.com?feedViewType=compactView",
+ "Llama 3.3 better than 4o, o1": "https://www.reddit.com/r/artificial/comments/1hg3xsw/llama_33_better_than_4o_o1/",
+ "u/socialmeai": "https://www.reddit.com/user/socialmeai/",
+ "Discussion": "https://www.reddit.com/r/artificial/?f=flair_name%3A%22Discussion%22",
+ "u/HoodyPrivacy": "https://www.reddit.com/user/HoodyPrivacy/",
+ "o1 scored in the top 1%-2% of participants in Putnam, one of the world's hardest math exams": "https://www.reddit.com/r/artificial/comments/1hfyosi/o1_scored_in_the_top_12_of_participants_in_putnam/",
+ "u/MetaKnowing": "https://www.reddit.com/user/MetaKnowing/",
+ "News": "https://www.reddit.com/r/artificial/?f=flair_name%3A%22News%22",
+ "https://x.com/Academisfit/status/1868529612554420489": "https://x.com/Academisfit/status/1868529612554420489",
+ "AI space blog": "https://www.reddit.com/r/artificial/comments/1hfzusc/ai_space_blog/",
+ "u/D3O2": "https://www.reddit.com/user/D3O2/",
+ "Media": "https://www.reddit.com/r/artificial/?f=flair_name%3A%22Media%22",
+ "Rank by size": "https://www.reddit.com/best/communities/4/#t5_2qhfb/",
+ "Click here for the full rule, it is also located in the Wiki": "https://www.reddit.com/r/artificial/wiki/guidelines/selfpromo/",
+ "AutoMod": "https://www.reddit.com/wiki/automoderator/",
+ "Trending AI Subreddits and Posts": "https://www.reddit.com/t/artificial_intelligence_and_machine_learning/",
+ "Fortune 50 AI List 2024": "https://fortune.com/ranking/ai-innovators/2024/",
+ "Time 100 AI List 2024": "https://time.com/collection/time100-ai-2024/",
+ "Forbes AI 50 List 2024": "https://www.forbes.com/lists/ai50/",
+ "OpenAI": "https://openai.com/news",
+ "Meta AI": "https://ai.meta.com/blog/?page=1",
+ "Google AI": "https://blog.google/technology/ai/",
+ "Microsoft AI": "https://news.microsoft.com/source/topics/ai/",
+ "IBM AI": "https://research.ibm.com/artificial-intelligence",
+ "Amazon AWS": "https://aws.amazon.com/ai/",
+ "Apple ML": "https://www.apple.com/apple-intelligence/",
+ "NVIDIA DL": "https://blogs.nvidia.com/blog/category/deep-learning/",
+ "Character.AI": "https://blog.character.ai/",
+ "Stability AI": "https://stability.ai/news",
+ "Anthropic": "https://www.anthropic.com/news",
+ "Mistral AI": "https://mistral.ai/news/",
+ "ElevenLabs": "https://elevenlabs.io/blog/",
+ "Figure AI": "https://www.figure.ai/?ref=viden.ai",
+ "Hugging Face": "https://huggingface.co/blog",
+ "Runway": "https://runwayml.com/blog/",
+ "Perplexity": "https://www.perplexity.ai/hub",
+ "Midjourney": "https://www.midjourney.com/home",
+ "Suno AI": "https://suno.com/blog/",
+ "Adobe AI": "https://www.adobe.com/ai/overview.html",
+ "Wiki": "https://www.reddit.com/r/artificial/wiki/index",
+ "Subreddit Update": "https://www.reddit.com/r/artificial/comments/120qr4r/psa_rule_2_will_be_enforced_selfpromotion_is_only/",
+ "More Communities": "https://www.reddit.com/r/artificial/wiki/related-subreddits/",
+ "r/ChatGPT": "https://www.reddit.com/r/ChatGPT",
+ "r/OpenAI": "https://www.reddit.com/r/OpenAI",
+ "r/ClaudeAI": "https://www.reddit.com/r/ClaudeAI",
+ "Amazing": "https://reddit.com/t/amazing/",
+ "Animals & Pets": "https://reddit.com/t/animals_and_pets/",
+ "Cringe & Facepalm": "https://reddit.com/t/cringe_and_facepalm/",
+ "Funny": "https://reddit.com/t/funny/",
+ "Interesting": "https://reddit.com/t/interesting/",
+ "Memes": "https://reddit.com/t/memes/",
+ "Oddly Satisfying": "https://reddit.com/t/oddly_satisfying/",
+ "Reddit Meta": "https://reddit.com/t/reddit_meta/",
+ "Wholesome & Heartwarming": "https://reddit.com/t/wholesome_and_heartwarming/",
+ "Action Games": "https://reddit.com/t/action_games/",
+ "Adventure Games": "https://reddit.com/t/adventure_games/",
+ "Esports": "https://reddit.com/t/esports/",
+ "Gaming Consoles & Gear": "https://reddit.com/t/gaming_consoles_and_gear/",
+ "Gaming News & Discussion": "https://reddit.com/t/gaming_news_and_discussion/",
+ "Mobile Games": "https://reddit.com/t/mobile_games/",
+ "Other Games": "https://reddit.com/t/other_games/",
+ "Role-Playing Games": "https://reddit.com/t/role_playing_games/",
+ "Simulation Games": "https://reddit.com/t/simulation_games/",
+ "Sports & Racing Games": "https://reddit.com/t/sports_and_racing_games/",
+ "Strategy Games": "https://reddit.com/t/strategy_games/",
+ "Tabletop Games": "https://reddit.com/t/tabletop_games/",
+ "Q&As": "https://reddit.com/t/q_and_as/",
+ "Stories & Confessions": "https://reddit.com/t/stories_and_confessions/",
+ "3D Printing": "https://reddit.com/t/3d_printing/",
+ "Artificial Intelligence & Machine Learning": "https://reddit.com/t/artificial_intelligence_and_machine_learning/",
+ "Computers & Hardware": "https://reddit.com/t/computers_and_hardware/",
+ "Consumer Electronics": "https://reddit.com/t/consumer_electronics/",
+ "DIY Electronics": "https://reddit.com/t/diy_electronics/",
+ "Programming": "https://reddit.com/t/programming/",
+ "Software & Apps": "https://reddit.com/t/software_and_apps/",
+ "Streaming Services": "https://reddit.com/t/streaming_services/",
+ "Tech News & Discussion": "https://reddit.com/t/tech_news_and_discussion/",
+ "Virtual & Augmented Reality": "https://reddit.com/t/virtual_and_augmented_reality/",
+ "Celebrities": "https://reddit.com/t/celebrities/",
+ "Creators & Influencers": "https://reddit.com/t/creators_and_influencers/",
+ "Generations & Nostalgia": "https://reddit.com/t/generations_and_nostalgia/",
+ "Podcasts": "https://reddit.com/t/podcasts/",
+ "Streamers": "https://reddit.com/t/streamers/",
+ "Tarot & Astrology": "https://reddit.com/t/tarot_and_astrology/",
+ "Action Movies & Series": "https://reddit.com/t/action_movies_and_series/",
+ "Animated Movies & Series": "https://reddit.com/t/animated_movies_and_series/",
+ "Comedy Movies & Series": "https://reddit.com/t/comedy_movies_and_series/",
+ "Crime, Mystery, & Thriller Movies & Series": "https://reddit.com/t/crime_mystery_and_thriller_movies_and_series/",
+ "Documentary Movies & Series": "https://reddit.com/t/documentary_movies_and_series/",
+ "Drama Movies & Series": "https://reddit.com/t/drama_movies_and_series/",
+ "Fantasy Movies & Series": "https://reddit.com/t/fantasy_movies_and_series/",
+ "Horror Movies & Series": "https://reddit.com/t/horror_movies_and_series/",
+ "Movie News & Discussion": "https://reddit.com/t/movie_news_and_discussion/",
+ "Reality TV": "https://reddit.com/t/reality_tv/",
+ "Romance Movies & Series": "https://reddit.com/t/romance_movies_and_series/",
+ "Sci-Fi Movies & Series": "https://reddit.com/t/scifi_movies_and_series/",
+ "Superhero Movies & Series": "https://reddit.com/t/superhero_movies_and_series/",
+ "TV News & Discussion": "https://reddit.com/t/tv_news_and_discussion/",
+ "About Reddit": "https://www.redditinc.com",
+ "Advertise": "https://accounts.reddit.com/adsregister?utm_source=web3x_consumer&utm_name=left_nav_cta",
+ "Help": "https://support.reddithelp.com/hc?utm_source=reddit&utm_medium=footer&utm_campaign=evergreen",
+ "Blog": "https://redditblog.com/",
+ "Careers": "https://www.redditinc.com/careers",
+ "Press": "https://www.redditinc.com/press",
+ "Communities": "https://www.reddit.com/best/communities/1/",
+ "Best of Reddit": "https://www.reddit.com/posts/2024/global/",
+ "Topics": "https://www.reddit.com/topics/a-1/",
+ "Content Policy": "https://www.redditinc.com/policies/content-policy",
+ "Privacy Policy": "https://www.reddit.com/policies/privacy-policy",
+ "User Agreement": "https://www.redditinc.com/policies/user-agreement",
+ "Reddit, Inc. © 2024. All rights reserved.": "https://redditinc.com"
+}
\ No newline at end of file
diff --git a/test/webpage_samples/_task2/29229b/screenshot.jpg b/test/webpage_samples/_task2/29229b/screenshot.jpg
new file mode 100644
index 0000000..0659c94
Binary files /dev/null and b/test/webpage_samples/_task2/29229b/screenshot.jpg differ
diff --git a/test/webpage_samples/_task2/29229b/text.txt b/test/webpage_samples/_task2/29229b/text.txt
new file mode 100644
index 0000000..41bf9f6
--- /dev/null
+++ b/test/webpage_samples/_task2/29229b/text.txt
@@ -0,0 +1,52 @@
+Skip to main content
+Get App
+Log In
+r/artificial
+u/socialmeai
+•
+Llama 3.3 better than 4o, o1
+
+I have started myself to shift from ChatGPT models because now they have started to go out of context for no reason.
+
+You ask them to make a summary of what we have discussed on this chat so far and it fails to note the important points.
+
+And if the chat is pretty lengthy, it just dismisses and gets bizarre info out of it.
+
+I think I smell the commercialness of it spreading across the room.
+
+I have had better output from the recent Microsoft's phi-4 model compared to 4o.
+
+u/HoodyPrivacy
+•
+Promoted
+Hoody AI: anonymous access to the best AI model providers from a privacy-first unified dashboard.
+hoody.com
+View More
+u/MetaKnowing
+•
+o1 scored in the top 1%-2% of participants in Putnam, one of the world's hardest math exams
+https://x.com/Academisfit/status/1868529612554420489
+u/D3O2
+•
+AI space blog
+TOPICS
+Internet Culture (Viral)
+Games
+Q&As
+Technology
+Pop Culture
+Movies & TV
+RESOURCES
+About Reddit
+Advertise
+Help
+Blog
+Careers
+Press
+Communities
+Best of Reddit
+Topics
+Content Policy
+Privacy Policy
+User Agreement
+Reddit, Inc. © 2024. All rights reserved.
\ No newline at end of file
diff --git a/test/webpage_samples/_task2/3958ab/link_dict.json b/test/webpage_samples/_task2/3958ab/link_dict.json
new file mode 100644
index 0000000..cdf07fb
--- /dev/null
+++ b/test/webpage_samples/_task2/3958ab/link_dict.json
@@ -0,0 +1,31 @@
+{
+ "MIT Technology Review": "https://www.technologyreview.com/",
+ "Featured": "https://www.technologyreview.com/featured",
+ "Topics": "https://www.technologyreview.com/all-topics",
+ "Newsletters": "https://www.technologyreview.com/newsletter-preferences",
+ "Events": "https://events.technologyreview.com/",
+ "Audio": "https://www.technologyreview.com/audio",
+ "Sign in": "https://www.technologyreview.com/login&redirectTo=/",
+ "Subscribe": "https://www.technologyreview.com/subscribe?itm_source=nav-button&itm_medium=onsite&itm_campaign=subscribe-BAU",
+ "Terms of Service": "https://www.technologyreview.com/terms-of-service/",
+ "Privacy Policy": "https://www.technologyreview.com/privacy",
+ "READ ABOUT OUR HISTORY": "https://www.technologyreview.com/supertopic/about/",
+ "ADVERTISE WITH US": "https://mediakit.technologyreview.com",
+ "Careers": "https://www.technologyreview.com/open-positions/",
+ "Custom content": "https://www.technologyreview.com/custom-content",
+ "Advertise with us": "https://mediakit.technologyreview.com/",
+ "International Editions": "https://www.technologyreview.com/international-editions/",
+ "Republishing": "https://www.technologyreview.com/republishing/",
+ "MIT Alumni News": "https://www.technologyreview.com/mit-news",
+ "Help & FAQ": "https://www.technologyreview.com/help/",
+ "My subscription": "https://subscriptions.technologyreview.com/loading.do?omedasite=MITTR_LAND",
+ "Editorial guidelines": "https://www.technologyreview.com/editorial-guidelines/",
+ "Privacy policy": "https://www.technologyreview.com/privacy/",
+ "Write for us": "https://www.technologyreview.com/how-to-pitch-mit-technology-review/",
+ "Contact us": "https://www.technologyreview.com/help#contact-us",
+ "linkedin opens in a new window": "https://www.linkedin.com/company/mit-technology-review",
+ "instagram opens in a new window": "https://www.instagram.com/technologyreview/",
+ "reddit opens in a new window": "https://www.reddit.com/user/techreview/",
+ "facebook opens in a new window": "https://www.facebook.com/technologyreview/",
+ "rss opens in a new window": "https://www.technologyreview.com/feed/"
+}
\ No newline at end of file
diff --git a/test/webpage_samples/_task2/3958ab/screenshot.jpg b/test/webpage_samples/_task2/3958ab/screenshot.jpg
new file mode 100644
index 0000000..0d2ded0
Binary files /dev/null and b/test/webpage_samples/_task2/3958ab/screenshot.jpg differ
diff --git a/test/webpage_samples/_task2/3958ab/text.txt b/test/webpage_samples/_task2/3958ab/text.txt
new file mode 100644
index 0000000..7f62521
--- /dev/null
+++ b/test/webpage_samples/_task2/3958ab/text.txt
@@ -0,0 +1,46 @@
+SKIP TO CONTENT
+MIT Technology Review
+SIGN IN
+SUBSCRIBE
+MIT Technology Review
+SIGN IN
+SUBSCRIBE
+The Algorithm
+
+A weekly newsletter that helps demystify artificial intelligence.
+
+Enter your email
+SIGN UP
+By signing up, you agree to our Terms of Service & Privacy Policy.
+Artificial intelligence
+The latest advances in the quest to build machines that can reason, learn, and act intelligently.
+NEWEST TO OLDEST
+ALL TOPICS
+The latest iteration of a legacy
+Founded at the Massachusetts Institute of Technology in 1899, MIT Technology Review is a world-renowned, independent media company whose insight, analysis, reviews, interviews and live events explain the newest technologies and their commercial, social and political impact.
+READ ABOUT OUR HISTORY
+Advertise with MIT Technology Review
+Elevate your brand to the forefront of conversation around emerging technologies that are radically transforming business. From event sponsorships to custom content to visually arresting video storytelling, advertising with MIT Technology Review creates opportunities for your brand to resonate with an unmatched audience of technology and business elite.
+ADVERTISE WITH US
+
+© 2024 MIT Technology Review
+
+About us
+Careers
+Custom content
+Advertise with us
+International Editions
+Republishing
+MIT Alumni News
+Help & FAQ
+My subscription
+Editorial guidelines
+Privacy policy
+Terms of Service
+Write for us
+Contact us
+linkedin opens in a new window
+instagram opens in a new window
+reddit opens in a new window
+facebook opens in a new window
+rss opens in a new window
\ No newline at end of file
diff --git a/test/webpage_samples/_task2/9c76f8/link_dict.json b/test/webpage_samples/_task2/9c76f8/link_dict.json
new file mode 100644
index 0000000..20c395d
--- /dev/null
+++ b/test/webpage_samples/_task2/9c76f8/link_dict.json
@@ -0,0 +1,189 @@
+{
+ "terms of service": "https://stackoverflow.com/legal/terms-of-service/public",
+ "privacy policy": "https://stackoverflow.com/legal/privacy-policy",
+ "Log in": "https://stackoverflow.com/users/login?ssrc=head&returnurl=https%3a%2f%2fstackoverflow.com%2fquestions%2ftagged%2fartificial-intelligence",
+ "About": "https://stackoverflow.co/",
+ "OverflowAI": "https://stackoverflow.co/teams/ai/?utm_medium=referral&utm_source=stackoverflow-community&utm_campaign=top-nav-bar&utm_content=overflowai",
+ "Stack Overflow for Teams\nWhere developers & technologists share private knowledge with coworkers": "https://stackoverflow.co/teams/?utm_medium=referral&utm_source=stackoverflow-community&utm_campaign=top-nav&utm_content=stack-overflow-for-teams",
+ "Advertising & Talent\nReach devs & technologists worldwide about your product, service or employer brand": "https://stackoverflow.co/advertising/?utm_medium=referral&utm_source=stackoverflow-community&utm_campaign=top-nav&utm_content=stack-overflow-advertising",
+ "OverflowAI\nGenAI features for Teams": "https://stackoverflow.co/teams/ai/?utm_medium=referral&utm_source=stackoverflow-community&utm_campaign=top-nav&utm_content=overflow-ai",
+ "OverflowAPI\nTrain & fine-tune LLMs": "https://stackoverflow.co/api-solutions/?utm_medium=referral&utm_source=stackoverflow-community&utm_campaign=top-nav&utm_content=overflow-api",
+ "Labs\nThe future of collective knowledge sharing": "https://stackoverflow.co/labs/?utm_medium=referral&utm_source=stackoverflow-community&utm_campaign=top-nav&utm_content=labs",
+ "About the company": "https://stackoverflow.co/?utm_medium=referral&utm_source=stackoverflow-community&utm_campaign=top-nav&utm_content=about-the-company",
+ "Visit the blog": "https://stackoverflow.blog/?utm_medium=referral&utm_source=stackoverflow-community&utm_campaign=top-nav&utm_content=blog",
+ "help": "https://stackoverflow.com/help",
+ "chat": "https://chat.stackoverflow.com/?tab=site&host=stackoverflow.com",
+ "Meta Stack Overflow": "https://meta.stackoverflow.com",
+ "Sign up": "https://stackoverflow.com/users/signup?ssrc=head&returnurl=https%3a%2f%2fstackoverflow.com%2fquestions%2ftagged%2fartificial-intelligence",
+ "log in": "https://stackoverflow.com/users/login?ssrc=site_switcher&returnurl=https%3a%2f%2fstackoverflow.com%2fquestions%2ftagged%2fartificial-intelligence",
+ "more stack exchange communities": "https://stackexchange.com/sites",
+ "company blog": "https://stackoverflow.blog",
+ "Home": "https://stackoverflow.com/",
+ "Questions": "https://stackoverflow.com/questions",
+ "Tags": "https://stackoverflow.com/tags",
+ "Users": "https://stackoverflow.com/users",
+ "Companies": "https://stackoverflow.com/jobs/companies?so_medium=stackoverflow&so_source=SiteNav",
+ "Jobs": "https://stackoverflow.com/jobs?source=so-left-nav",
+ "Discussions": "https://stackoverflow.com/beta/discussions",
+ "Explore all Collectives": "https://stackoverflow.com/collectives-all",
+ "Try Teams for free": "https://stackoverflowteams.com/teams/create/free/?utm_medium=referral&utm_source=stackoverflow-community&utm_campaign=side-bar&utm_content=explore-teams",
+ "Explore Teams": "https://stackoverflow.co/teams/?utm_medium=referral&utm_source=stackoverflow-community&utm_campaign=side-bar&utm_content=explore-teams-compact",
+ "Learn more about Collectives": "https://stackoverflow.com/collectives",
+ "Learn more about Teams": "https://stackoverflow.co/teams/",
+ "Learn more about Labs": "https://stackoverflow.co/labs/",
+ "Go to Wiki": "https://stackoverflow.com/tags/artificial-intelligence/info",
+ "Newest": "https://stackoverflow.com/questions/tagged/artificial-intelligence?tab=Newest",
+ "Active": "https://stackoverflow.com/questions/tagged/artificial-intelligence?tab=Active",
+ "Bountied": "https://stackoverflow.com/questions/tagged/artificial-intelligence?tab=Bounties",
+ "Unanswered": "https://stackoverflow.com/questions/tagged/artificial-intelligence?tab=Unanswered",
+ "Frequent": "https://stackoverflow.com/questions/tagged/artificial-intelligence?tab=Frequent",
+ "Score": "https://stackoverflow.com/questions/tagged/artificial-intelligence?tab=Votes",
+ "Trending": "https://stackoverflow.com/questions/tagged/artificial-intelligence?tab=Trending",
+ "Week": "https://stackoverflow.com/questions/tagged/artificial-intelligence?tab=Week",
+ "Month": "https://stackoverflow.com/questions/tagged/artificial-intelligence?tab=Month",
+ "How to use chatgpt for reviewing and analizing my Oracle database [closed]": "https://stackoverflow.com/questions/79284988/how-to-use-chatgpt-for-reviewing-and-analizing-my-oracle-database",
+ "artificial-intelligence": "https://stackoverflow.com/questions/tagged/artificial-intelligence",
+ "chatgpt-api": "https://stackoverflow.com/questions/tagged/chatgpt-api",
+ "chat-gpt-4": "https://stackoverflow.com/questions/tagged/chat-gpt-4",
+ "Delmonte": "https://stackoverflow.com/users/1786620/delmonte",
+ "InsightFace not using GPU [closed]": "https://stackoverflow.com/questions/79284653/insightface-not-using-gpu",
+ "deep-learning": "https://stackoverflow.com/questions/tagged/artificial-intelligence+deep-learning",
+ "cuda": "https://stackoverflow.com/questions/tagged/cuda",
+ "face-recognition": "https://stackoverflow.com/questions/tagged/face-recognition",
+ "onnxruntime": "https://stackoverflow.com/questions/tagged/onnxruntime",
+ "Khawar Ali": "https://stackoverflow.com/users/23395527/khawar-ali",
+ "No module named 'ppaquette_gym_doom'": "https://stackoverflow.com/questions/79284559/no-module-named-ppaquette-gym-doom",
+ "python": "https://stackoverflow.com/questions/tagged/artificial-intelligence+python",
+ "신현빈": "https://stackoverflow.com/users/28800504/%ec%8b%a0%ed%98%84%eb%b9%88",
+ "Conversation agents Playbook '00000000-0000-0000-0000-000000000000' does not exist in the agent [closed]": "https://stackoverflow.com/questions/79284150/conversation-agents-playbook-00000000-0000-0000-0000-000000000000-does-not-exi",
+ "google-cloud-platform": "https://stackoverflow.com/questions/tagged/google-cloud-platform",
+ "vertex": "https://stackoverflow.com/questions/tagged/vertex",
+ "google-play-books": "https://stackoverflow.com/questions/tagged/google-play-books",
+ "EVIO COOL": "https://stackoverflow.com/users/28802076/evio-cool",
+ "How to Improve CNN Model Performance for Image Classification in PyTorch? [closed]": "https://stackoverflow.com/questions/79283377/how-to-improve-cnn-model-performance-for-image-classification-in-pytorch",
+ "pytorch": "https://stackoverflow.com/questions/tagged/artificial-intelligence+pytorch",
+ "kaggle": "https://stackoverflow.com/questions/tagged/kaggle",
+ "Ahmed Efe Petek": "https://stackoverflow.com/users/23337041/ahmed-efe-petek",
+ "R_max algorithm doesn't converge to the right policy": "https://stackoverflow.com/questions/79283112/r-max-algorithm-doesnt-converge-to-the-right-policy",
+ "reinforcement-learning": "https://stackoverflow.com/questions/tagged/artificial-intelligence+reinforcement-learning",
+ "Daniel Dubinskey": "https://stackoverflow.com/users/28795088/daniel-dubinskey",
+ "Issue with mismatched tensor sizes during training with DeepSpeed [closed]": "https://stackoverflow.com/questions/79281852/issue-with-mismatched-tensor-sizes-during-training-with-deepspeed",
+ "huggingface-trainer": "https://stackoverflow.com/questions/tagged/huggingface-trainer",
+ "warrw": "https://stackoverflow.com/users/28777459/warrw",
+ "Contrastive Loss from Scratch": "https://stackoverflow.com/questions/79279472/contrastive-loss-from-scratch",
+ "loss-function": "https://stackoverflow.com/questions/tagged/loss-function",
+ "self-supervised-learning": "https://stackoverflow.com/questions/tagged/self-supervised-learning",
+ "brzig": "https://stackoverflow.com/users/12548231/brzig",
+ "Where can I find datasets for medical document analysis and disease diagnosis using NLP? [closed]": "https://stackoverflow.com/questions/79276072/where-can-i-find-datasets-for-medical-document-analysis-and-disease-diagnosis-us",
+ "machine-learning": "https://stackoverflow.com/questions/tagged/artificial-intelligence+machine-learning",
+ "nlp": "https://stackoverflow.com/questions/tagged/artificial-intelligence+nlp",
+ "dataset": "https://stackoverflow.com/questions/tagged/dataset",
+ "jlassi Mohamed Hani": "https://stackoverflow.com/users/28756112/jlassi-mohamed-hani",
+ "Error: \"Vectors must have the same length as the number of dimensions\" when adding documents to FAISS vector store in LangChain [closed]": "https://stackoverflow.com/questions/79274478/error-vectors-must-have-the-same-length-as-the-number-of-dimensions-when-addi",
+ "langchain": "https://stackoverflow.com/questions/tagged/langchain",
+ "large-language-model": "https://stackoverflow.com/questions/tagged/artificial-intelligence+large-language-model",
+ "rag": "https://stackoverflow.com/questions/tagged/rag",
+ "llamacpp": "https://stackoverflow.com/questions/tagged/llamacpp",
+ "Yahoo": "https://stackoverflow.com/users/21913499/yahoo",
+ "Classify images based on line thickness,, text size, and background color [closed]": "https://stackoverflow.com/questions/79273650/classify-images-based-on-line-thickness-text-size-and-background-color",
+ "image-processing": "https://stackoverflow.com/questions/tagged/image-processing",
+ "computer-vision": "https://stackoverflow.com/questions/tagged/artificial-intelligence+computer-vision",
+ "Andres": "https://stackoverflow.com/users/128507/andres",
+ "Which representation of the Softmax function is correct? [closed]": "https://stackoverflow.com/questions/79272621/which-representation-of-the-softmax-function-is-correct",
+ "neural-network": "https://stackoverflow.com/questions/tagged/artificial-intelligence+neural-network",
+ "activation-function": "https://stackoverflow.com/questions/tagged/activation-function",
+ "zhiyuan lee": "https://stackoverflow.com/users/28737784/zhiyuan-lee",
+ "VS code extension that uses OpenAI API doens't work": "https://stackoverflow.com/questions/79272471/vs-code-extension-that-uses-openai-api-doenst-work",
+ "javascript": "https://stackoverflow.com/questions/tagged/artificial-intelligence+javascript",
+ "vscode-extensions": "https://stackoverflow.com/questions/tagged/vscode-extensions",
+ "openai-api": "https://stackoverflow.com/questions/tagged/openai-api",
+ "Maayan L": "https://stackoverflow.com/users/28734946/maayan-l",
+ "In the field of Generalized Planning, how can a policy be derived? [closed]": "https://stackoverflow.com/questions/79272256/in-the-field-of-generalized-planning-how-can-a-policy-be-derived",
+ "policy": "https://stackoverflow.com/questions/tagged/policy",
+ "planning": "https://stackoverflow.com/questions/tagged/planning",
+ "pddl": "https://stackoverflow.com/questions/tagged/pddl",
+ "xiang xiang": "https://stackoverflow.com/users/28299215/xiang-xiang",
+ "Is there a “How do you like Github Copilot to respond?” in GitHub Copilot? [closed]": "https://stackoverflow.com/questions/79270164/is-there-a-how-do-you-like-github-copilot-to-respond-in-github-copilot",
+ "intellij-idea": "https://stackoverflow.com/questions/tagged/intellij-idea",
+ "github-copilot": "https://stackoverflow.com/questions/tagged/github-copilot",
+ "akuma8": "https://stackoverflow.com/users/6643803/akuma8",
+ "15": "https://stackoverflow.com/questions/tagged/artificial-intelligence?tab=newest&pagesize=15",
+ "30": "https://stackoverflow.com/questions/tagged/artificial-intelligence?tab=newest&pagesize=30",
+ "50": "https://stackoverflow.com/questions/tagged/artificial-intelligence?tab=newest&pagesize=50",
+ "2": "https://stackoverflow.com/questions/tagged/artificial-intelligence?tab=newest&page=2&pagesize=15",
+ "3": "https://stackoverflow.com/questions/tagged/artificial-intelligence?tab=newest&page=3&pagesize=15",
+ "4": "https://stackoverflow.com/questions/tagged/artificial-intelligence?tab=newest&page=4&pagesize=15",
+ "5": "https://stackoverflow.com/questions/tagged/artificial-intelligence?tab=newest&page=5&pagesize=15",
+ "597": "https://stackoverflow.com/questions/tagged/artificial-intelligence?tab=newest&page=597&pagesize=15",
+ "AI agents that help doctors get paid": "https://stackoverflow.blog/2024/12/13/ai-agents-that-help-doctors-get-paid/?cb=1",
+ "Legal advice from an AI is illegal": "https://stackoverflow.blog/2024/12/17/legal-advice-from-an-ai-is-illegal/?cb=1",
+ "The December 2024 Community Asks Sprint has been moved to March 2025 (and...": "https://meta.stackexchange.com/questions/404724/the-december-2024-community-asks-sprint-has-been-moved-to-march-2025-and-length?cb=1",
+ "Stack Overflow Jobs is expanding to more countries": "https://meta.stackexchange.com/questions/404909/stack-overflow-jobs-is-expanding-to-more-countries?cb=1",
+ "algorithm": "https://stackoverflow.com/questions/tagged/artificial-intelligence+algorithm",
+ "tensorflow": "https://stackoverflow.com/questions/tagged/artificial-intelligence+tensorflow",
+ "java": "https://stackoverflow.com/questions/tagged/artificial-intelligence+java",
+ "c#": "https://stackoverflow.com/questions/tagged/artificial-intelligence+c%23",
+ "keras": "https://stackoverflow.com/questions/tagged/artificial-intelligence+keras",
+ "minimax": "https://stackoverflow.com/questions/tagged/artificial-intelligence+minimax",
+ "python-3.x": "https://stackoverflow.com/questions/tagged/artificial-intelligence+python-3.x",
+ "conv-neural-network": "https://stackoverflow.com/questions/tagged/artificial-intelligence+conv-neural-network",
+ "search": "https://stackoverflow.com/questions/tagged/artificial-intelligence+search",
+ "c++": "https://stackoverflow.com/questions/tagged/artificial-intelligence%20c%2b%2b",
+ "chatbot": "https://stackoverflow.com/questions/tagged/artificial-intelligence+chatbot",
+ "genetic-algorithm": "https://stackoverflow.com/questions/tagged/artificial-intelligence+genetic-algorithm",
+ "unity-game-engine": "https://stackoverflow.com/questions/tagged/artificial-intelligence+unity-game-engine",
+ "a-star": "https://stackoverflow.com/questions/tagged/artificial-intelligence+a-star",
+ "heuristics": "https://stackoverflow.com/questions/tagged/artificial-intelligence+heuristics",
+ "Hot Network Questions": "https://stackexchange.com/questions?tab=hot",
+ "Why no \"full-stack\" SQL-like language?": "https://langdev.stackexchange.com/questions/4192/why-no-full-stack-sql-like-language",
+ "Why would David not drink the water?": "https://hermeneutics.stackexchange.com/questions/99838/why-would-david-not-drink-the-water",
+ "Should I remove extra water that leaked into sauerkraut?": "https://cooking.stackexchange.com/questions/129782/should-i-remove-extra-water-that-leaked-into-sauerkraut",
+ "Compactness Theorem for propositional Calculus": "https://philosophy.stackexchange.com/questions/120498/compactness-theorem-for-propositional-calculus",
+ "If I sacrifice a Forsaken Miner to the card Eaten Alive do I get the miner back?": "https://boardgames.stackexchange.com/questions/61640/if-i-sacrifice-a-forsaken-miner-to-the-card-eaten-alive-do-i-get-the-miner-back",
+ "Is it OK to use longjmp to break out of qsort?": "https://stackoverflow.com/questions/79286221/is-it-ok-to-use-longjmp-to-break-out-of-qsort",
+ "Why are languages commonly structured as trees?": "https://philosophy.stackexchange.com/questions/120393/why-are-languages-commonly-structured-as-trees",
+ "Would a siyum the night before the fast of the first born count?": "https://judaism.stackexchange.com/questions/146473/would-a-siyum-the-night-before-the-fast-of-the-first-born-count",
+ "How to determine what is opening tmp files when I invoke a subshell with ksh": "https://unix.stackexchange.com/questions/788233/how-to-determine-what-is-opening-tmp-files-when-i-invoke-a-subshell-with-ksh",
+ "Expressing an assumption that all variables are mutually distinct and come from a specified set": "https://mathematica.stackexchange.com/questions/309469/expressing-an-assumption-that-all-variables-are-mutually-distinct-and-come-from",
+ "How do we provide permission to use a figure that we hired a graphic designer to create in SciRep?": "https://academia.stackexchange.com/questions/215548/how-do-we-provide-permission-to-use-a-figure-that-we-hired-a-graphic-designer-to",
+ "Does the double origin plane have a cut point?": "https://math.stackexchange.com/questions/5012375/does-the-double-origin-plane-have-a-cut-point",
+ "Why does the media establishment still refer to the Syrian revolutionary forces as rebels?": "https://politics.stackexchange.com/questions/90088/why-does-the-media-establishment-still-refer-to-the-syrian-revolutionary-forces",
+ "have someone to do something": "https://ell.stackexchange.com/questions/360421/have-someone-to-do-something",
+ "Prove that the entanglement definition of AME implies the error correction definition of AME": "https://quantumcomputing.stackexchange.com/questions/40691/prove-that-the-entanglement-definition-of-ame-implies-the-error-correction-defin",
+ "Is SQL Injection possible if we're using only the IN keyword (no equals = operator) and we handle the single quote": "https://security.stackexchange.com/questions/279871/is-sql-injection-possible-if-were-using-only-the-in-keyword-no-equals-operat",
+ "How do I get rid of the yellow tint when using Sky Texture?": "https://blender.stackexchange.com/questions/328530/how-do-i-get-rid-of-the-yellow-tint-when-using-sky-texture",
+ "EES/ETIAS in Schengen after 1-day overstay?": "https://travel.stackexchange.com/questions/192647/ees-etias-in-schengen-after-1-day-overstay",
+ "Japanese passport and Philippine passport with different signatures: ok when traveling to another country?": "https://travel.stackexchange.com/questions/192640/japanese-passport-and-philippine-passport-with-different-signatures-ok-when-tra",
+ "What is the meaning of the second line of the piecewise output of SeriesCoefficient[]?": "https://mathematica.stackexchange.com/questions/309456/what-is-the-meaning-of-the-second-line-of-the-piecewise-output-of-seriescoeffici",
+ "How to teach high school students to analyze diagrams in a proof?": "https://matheducators.stackexchange.com/questions/28346/how-to-teach-high-school-students-to-analyze-diagrams-in-a-proof",
+ "What is the wave function for alpha decay?": "https://physics.stackexchange.com/questions/837316/what-is-the-wave-function-for-alpha-decay",
+ "PSE Advent Calendar 2024 (Day 16): Holly Jolly Cryptic Word Tapestry": "https://puzzling.stackexchange.com/questions/129675/pse-advent-calendar-2024-day-16-holly-jolly-cryptic-word-tapestry",
+ "Regarding Isaiah 9:6, which text has the original rendering, LXX or MT, and why does the false rendering differ significantly from the original?": "https://hermeneutics.stackexchange.com/questions/99843/regarding-isaiah-96-which-text-has-the-original-rendering-lxx-or-mt-and-why",
+ "Newest artificial-intelligence questions feed": "https://stackoverflow.com/feeds/tag?tagnames=artificial-intelligence&sort=newest",
+ "Help": "https://stackoverflow.com/help",
+ "Teams": "https://stackoverflow.co/teams/?utm_medium=referral&utm_source=stackoverflow-community&utm_campaign=footer&utm_content=teams",
+ "Advertising": "https://stackoverflow.co/advertising/?utm_medium=referral&utm_source=stackoverflow-community&utm_campaign=footer&utm_content=advertising",
+ "Talent": "https://stackoverflow.co/advertising/employer-branding/?utm_medium=referral&utm_source=stackoverflow-community&utm_campaign=footer&utm_content=talent",
+ "Press": "https://stackoverflow.co/company/press/",
+ "Work Here": "https://stackoverflow.co/company/work-here/",
+ "Legal": "https://stackoverflow.com/legal",
+ "Privacy Policy": "https://stackoverflow.com/legal/privacy-policy",
+ "Terms of Service": "https://stackoverflow.com/legal/terms-of-service/public",
+ "Contact Us": "https://stackoverflow.com/contact",
+ "Cookie Policy": "https://stackoverflow.com/legal/cookie-policy",
+ "Stack Exchange Network": "https://stackexchange.com",
+ "Technology": "https://stackexchange.com/sites#technology",
+ "Culture & recreation": "https://stackexchange.com/sites#culturerecreation",
+ "Life & arts": "https://stackexchange.com/sites#lifearts",
+ "Science": "https://stackexchange.com/sites#science",
+ "Professional": "https://stackexchange.com/sites#professional",
+ "Business": "https://stackexchange.com/sites#business",
+ "API": "https://api.stackexchange.com/",
+ "Data": "https://data.stackexchange.com/",
+ "Blog": "https://stackoverflow.blog?blb=1",
+ "Facebook": "https://www.facebook.com/officialstackoverflow/",
+ "Twitter": "https://twitter.com/stackoverflow",
+ "LinkedIn": "https://linkedin.com/company/stack-overflow",
+ "Instagram": "https://www.instagram.com/thestackoverflow",
+ "CC BY-SA": "https://stackoverflow.com/help/licensing"
+}
\ No newline at end of file
diff --git a/test/webpage_samples/_task2/9c76f8/screenshot.jpg b/test/webpage_samples/_task2/9c76f8/screenshot.jpg
new file mode 100644
index 0000000..9078e1b
Binary files /dev/null and b/test/webpage_samples/_task2/9c76f8/screenshot.jpg differ
diff --git a/test/webpage_samples/_task2/9c76f8/text.txt b/test/webpage_samples/_task2/9c76f8/text.txt
new file mode 100644
index 0000000..6ef7f8b
--- /dev/null
+++ b/test/webpage_samples/_task2/9c76f8/text.txt
@@ -0,0 +1,311 @@
+Skip to main content
+Stack Overflow
+About
+Products
+OverflowAI
+Log in
+Sign up
+Home
+Questions
+Tags
+Users
+Companies
+LABS
+Jobs
+Discussions
+COLLECTIVES
+
+Communities for your favorite technologies. Explore all Collectives
+
+TEAMS
+
+Ask questions, find answers and collaborate at work with Stack Overflow for Teams.
+
+Try Teams for free Explore Teams
+[artificial-intelligence]
+
+NOTE: If you want to use this tag for a question not directly concerning implementation, then consider posting on Artificial Intelligence, Computer Science, Data Science, Cross Validated, or GenAI (beta) instead; ...
+
+Sign up to watch this tag and see more personalized content
+
+Watch tag
+Go to Wiki
+8,954 questions
+Newest
+Active
+Bountied
+Unanswered
+More
+ Filter
+-4
+votes
+0
+answers
+20
+views
+How to use chatgpt for reviewing and analizing my Oracle database [closed]
+I frequently use ChatGPT for various tasks such as writing documents, developing SQL queries, programming functions, and more. However, I would like to utilize ChatGPT specifically to analyze some ...
+artificial-intelligencechatgpt-apichat-gpt-4
+Delmonte
+403
+asked 20 hours ago
+-3
+votes
+0
+answers
+17
+views
+InsightFace not using GPU [closed]
+I am building a face recognition system. I have Nvidia 1660 6GB super installed. I have written all the code. But it is not using GPU. On CPU, it is very slow. I have tried multiple versions of Nvidia ...
+deep-learningcudaartificial-intelligenceface-recognitiononnxruntime
+Khawar Ali
+1
+asked 22 hours ago
+0
+votes
+1
+answer
+15
+views
+No module named 'ppaquette_gym_doom'
+i use spyder i tried to install ppaquette_gym_doom but failed i tried to install doom-py and failed Failed building wheel for doom-py this is error secntence but i can't understand what it means i ...
+pythonartificial-intelligence
+신현빈
+1
+asked 23 hours ago
+-1
+votes
+0
+answers
+28
+views
+Conversation agents Playbook '00000000-0000-0000-0000-000000000000' does not exist in the agent [closed]
+Trying to get the conversation of the setup agent to start from the Playbook GAI instead of the flow. After changing that setting, I get this error: conversation agents Playbook '00000000-0000-0000-...
+ google-cloud-platformartificial-intelligencevertexgoogle-play-books
+EVIO COOL
+1
+asked yesterday
+-1
+votes
+0
+answers
+20
+views
+How to Improve CNN Model Performance for Image Classification in PyTorch? [closed]
+I am working on an image classification project using PyTorch and have implemented a Convolutional Neural Network (CNN) model. While the model is functional, I am looking for ways to improve its ...
+pythonpytorchartificial-intelligencekaggle
+Ahmed Efe Petek
+3
+asked yesterday
+0
+votes
+0
+answers
+16
+views
+R_max algorithm doesn't converge to the right policy
+I have a task where I need to implement an R_max algorithm with modified policy itieration over the forzen lake problem. I first tried to just implement a regular modified policy iteration and it ...
+pythonartificial-intelligencereinforcement-learning
+Daniel Dubinskey
+9
+asked yesterday
+-1
+votes
+0
+answers
+12
+views
+Issue with mismatched tensor sizes during training with DeepSpeed [closed]
+I'm training a model using Hugging Face's Trainer with DeepSpeed integration, and I'm encountering an error related to mismatched tensor sizes: The size of tensor a (50) must match the size of tensor ...
+pythonartificial-intelligencehuggingface-trainer
+warrw
+7
+asked 2 days ago
+1
+vote
+1
+answer
+41
+views
+Contrastive Loss from Scratch
+I am trying to implement/learn how to implement contrastive loss. Currently my gradients are exploding into infinity and I think I must have misimplemented something. I was wondering if someone could ...
+deep-learningpytorchartificial-intelligenceloss-functionself-supervised-learning
+brzig
+35
+asked Dec 13 at 20:16
+-2
+votes
+0
+answers
+14
+views
+Where can I find datasets for medical document analysis and disease diagnosis using NLP? [closed]
+I'm working on a healthcare-related project where I need to analyze medical documents, extract specific values (e.g., creatinine, glucose levels, etc.), and generate personalized paragraphs for ...
+ machine-learningdeep-learningnlpdatasetartificial-intelligence
+jlassi Mohamed Hani
+1
+asked Dec 12 at 17:39
+-1
+votes
+0
+answers
+13
+views
+Error: "Vectors must have the same length as the number of dimensions" when adding documents to FAISS vector store in LangChain [closed]
+I'm trying to embed and store documents in a FAISS vector store using LangChain, but I'm encountering the error: Vectors must have the same length as the number of dimensions I'm using a locally ...
+artificial-intelligencelangchainlarge-language-modelragllamacpp
+Yahoo
+1
+asked Dec 12 at 9:21
+-2
+votes
+0
+answers
+26
+views
+Classify images based on line thickness,, text size, and background color [closed]
+I'm trying to find a way to classify images based on their aptitude to be printed on clothing, ideally using a python library. The main thing I'm trying to do is find text size and color and general ...
+pythonmachine-learningimage-processingcomputer-visionartificial-intelligence
+Andres
+2,896
+asked Dec 12 at 2:14
+-1
+votes
+0
+answers
+34
+views
+Which representation of the Softmax function is correct? [closed]
+I came across the formula for the Softmax function: Softmax formula However, I've found two very different visual representations of the Softmax function, and I'm confused about which one is correct: ...
+machine-learningneural-networkartificial-intelligenceactivation-function
+zhiyuan lee
+11
+asked Dec 11 at 17:19
+0
+votes
+0
+answers
+30
+views
+VS code extension that uses OpenAI API doens't work
+I want to write a simple VS Code extension that calls OpenAI API and tells the user the day in Danish. I cannot find the extension when searching for it in the Extension Development Host window (after ...
+javascriptartificial-intelligencevscode-extensionsopenai-api
+Maayan L
+1
+asked Dec 11 at 16:25
+-3
+votes
+0
+answers
+12
+views
+In the field of Generalized Planning, how can a policy be derived? [closed]
+In the field of generalized planning, for a classical planning problem, we can only use classical planners (such as Fast Downward) to derive an action sequence, which is essentially a plan. However, I ...
+artificial-intelligencepolicyplanningpddl
+xiang xiang
+1
+asked Dec 11 at 15:25
+-2
+votes
+1
+answer
+41
+views
+Is there a “How do you like Github Copilot to respond?” in GitHub Copilot? [closed]
+With ChatGPT we have the option: “How would you like ChatGPT to respond?” Where we can give indications on how we expect it to respond. Is the same feature available in GitHub Copilot(GC) or are there ...
+intellij-ideaartificial-intelligencegithub-copilot
+akuma8
+4,641
+asked Dec 11 at 0:32
+
+
+15
+30
+50
+per page
+1
+2
+3
+4
+5
+…
+597
+Next
+The Overflow Blog
+AI agents that help doctors get paid
+Legal advice from an AI is illegal
+Featured on Meta
+The December 2024 Community Asks Sprint has been moved to March 2025 (and...
+Stack Overflow Jobs is expanding to more countries
+Related Tags
+python × 2550
+machine-learning × 2102
+neural-network × 1153
+algorithm × 886
+tensorflow × 706
+deep-learning × 589
+java × 561
+nlp × 414
+c# × 356
+keras × 341
+more related tags
+Hot Network Questions
+Why no "full-stack" SQL-like language?
+Why would David not drink the water?
+Should I remove extra water that leaked into sauerkraut?
+Compactness Theorem for propositional Calculus
+If I sacrifice a Forsaken Miner to the card Eaten Alive do I get the miner back?
+Is it OK to use longjmp to break out of qsort?
+Why are languages commonly structured as trees?
+Would a siyum the night before the fast of the first born count?
+How to determine what is opening tmp files when I invoke a subshell with ksh
+Expressing an assumption that all variables are mutually distinct and come from a specified set
+How do we provide permission to use a figure that we hired a graphic designer to create in SciRep?
+Does the double origin plane have a cut point?
+Why does the media establishment still refer to the Syrian revolutionary forces as rebels?
+have someone to do something
+Prove that the entanglement definition of AME implies the error correction definition of AME
+Is SQL Injection possible if we're using only the IN keyword (no equals = operator) and we handle the single quote
+How do I get rid of the yellow tint when using Sky Texture?
+EES/ETIAS in Schengen after 1-day overstay?
+Japanese passport and Philippine passport with different signatures: ok when traveling to another country?
+What is the meaning of the second line of the piecewise output of SeriesCoefficient[]?
+How to teach high school students to analyze diagrams in a proof?
+What is the wave function for alpha decay?
+PSE Advent Calendar 2024 (Day 16): Holly Jolly Cryptic Word Tapestry
+Regarding Isaiah 9:6, which text has the original rendering, LXX or MT, and why does the false rendering differ significantly from the original?
+ Newest artificial-intelligence questions feed
+STACK OVERFLOW
+Questions
+Help
+Chat
+PRODUCTS
+Teams
+Advertising
+Talent
+COMPANY
+About
+Press
+Work Here
+Legal
+Privacy Policy
+Terms of Service
+Contact Us
+Cookie Settings
+Cookie Policy
+STACK EXCHANGE NETWORK
+Technology
+Culture & recreation
+Life & arts
+Science
+Professional
+Business
+API
+Data
+Blog
+Facebook
+Twitter
+LinkedIn
+Instagram
+
+Site design / logo © 2024 Stack Exchange Inc; user contributions licensed under CC BY-SA . rev 2024.12.17.20550
\ No newline at end of file
diff --git a/test/webpage_samples/_task2/ae77d4/link_dict.json b/test/webpage_samples/_task2/ae77d4/link_dict.json
new file mode 100644
index 0000000..d4441cb
--- /dev/null
+++ b/test/webpage_samples/_task2/ae77d4/link_dict.json
@@ -0,0 +1,137 @@
+{
+ "Events": "https://events.venturebeat.com/",
+ "Video": "https://venturebeat.com/video/",
+ "Special Issues": "https://venturebeat.com/venturebeat-special-issues/",
+ "Jobs": "https://jobs.venturebeat.com/?source=navbar&utm_source=navbar&utm_medium=partner_referral",
+ "VentureBeat Homepage": "https://venturebeat.com/",
+ "Subscribe": "https://venturebeat.com/newsletters/?utm_source=VBsite&utm_medium=mobileNav",
+ "Artificial Intelligence": "https://venturebeat.com/category/ai/",
+ "AI, ML and Deep Learning": "https://venturebeat.com/tag/ai-ml-deep-learning/",
+ "Auto ML": "https://venturebeat.com/tag/auto-ml/",
+ "Data Labelling": "https://venturebeat.com/tag/data-labelling/",
+ "Synthetic Data": "https://venturebeat.com/tag/synthetic-data/",
+ "Conversational AI": "https://venturebeat.com/tag/conversational-ai/",
+ "NLP": "https://venturebeat.com/tag/nlp/",
+ "Text-to-Speech": "https://venturebeat.com/tag/text-to-speech/",
+ "Security": "https://venturebeat.com/category/security/",
+ "Data Security and Privacy": "https://venturebeat.com/tag/data-security-privacy/",
+ "Network Security and Privacy": "https://venturebeat.com/tag/network-security-privacy/",
+ "Software Security": "https://venturebeat.com/tag/software-security/",
+ "Computer Hardware Security": "https://venturebeat.com/tag/computer-hardware-security/",
+ "Cloud and Data Storage Security": "https://venturebeat.com/tag/cloud-data-storage-security/",
+ "Data Infrastructure": "https://venturebeat.com/category/data-infrastructure/",
+ "Data Science": "https://venturebeat.com/tag/data-science/",
+ "Data Management": "https://venturebeat.com/tag/data-management/",
+ "Data Storage and Cloud": "https://venturebeat.com/tag/data-storage-cloud/",
+ "Big Data and Analytics": "https://venturebeat.com/tag/big-data-and-analytics/",
+ "Data Networks": "https://venturebeat.com/tag/data-networks/",
+ "Automation": "https://venturebeat.com/category/automation/",
+ "Industrial Automation": "https://venturebeat.com/tag/industrial-automation/",
+ "Business Process Automation": "https://venturebeat.com/tag/business-process-automation/",
+ "Development Automation": "https://venturebeat.com/tag/development-automation/",
+ "Robotic Process Automation": "https://venturebeat.com/tag/robotic-process-automation/",
+ "Test Automation": "https://venturebeat.com/tag/test-automation/",
+ "Enterprise Analytics": "https://venturebeat.com/category/enterprise-analytics/",
+ "Business Intelligence": "https://venturebeat.com/tag/business-intelligence/",
+ "Disaster Recovery Business Continuity": "https://venturebeat.com/tag/disaster-recovery-business-continuity/",
+ "Statistical Analysis": "https://venturebeat.com/tag/statistical-analysis/",
+ "Predictive Analysis": "https://venturebeat.com/tag/predictive-analysis/",
+ "Data Decision Makers": "https://venturebeat.com/category/datadecisionmakers/",
+ "Virtual Communication": "https://venturebeat.com/category/virtual/",
+ "Team Collaboration": "https://venturebeat.com/tag/team-collaboration/",
+ "UCaaS": "https://venturebeat.com/tag/ucaas/",
+ "Virtual Reality Collaboration": "https://venturebeat.com/tag/virtual-reality-collaboration/",
+ "Virtual Employee Experience": "https://venturebeat.com/tag/virtual-employee-experience/",
+ "Programming & Development": "https://venturebeat.com/category/programming-development/",
+ "Product Development": "https://venturebeat.com/tag/product-development/",
+ "Application Development": "https://venturebeat.com/tag/application-development/",
+ "Test Management": "https://venturebeat.com/tag/test-management/",
+ "Development Languages": "https://venturebeat.com/tag/development-languages/",
+ "Gemini 2.0 Flash ushers in a new era of real-time multimodal AI": "https://venturebeat.com/ai/gemini-2-0-flash-ushers-in-a-new-era-of-real-time-multimodal-ai/",
+ "Nvidia unveils next-gen AI and industrial digitalization capabilities at Microsoft Ignite": "https://venturebeat.com/ai/nvidia-unveils-next-gen-ai-and-industrial-digitalization-capabilities-at-microsoft-ignite/",
+ "New LLM optimization technique slashes memory costs up to 75%": "https://venturebeat.com/ai/new-llm-optimization-technique-slashes-memory-costs-up-to-75/",
+ "Geopolitics and AI will affect the chip industry in 2025 | KPMG": "https://venturebeat.com/ai/geopolitics-and-ai-will-affect-the-chip-industry-in-2025-kpmg/",
+ "Dean Takahashi": "https://venturebeat.com/author/dean-takahashi/",
+ "MidJourney adds Pinterest-like ‘moodboards’ and support for multiple custom AI image models": "https://venturebeat.com/ai/midjourney-adds-pinterest-like-moodboards-and-support-for-multiple-custom-ai-image-models/",
+ "Carl Franzen": "https://venturebeat.com/author/carlfranzen/",
+ "Slack’s AI agents promise to reshape productivity with contextual power": "https://venturebeat.com/ai/slacks-ai-agents-promise-to-reshape-productivity-with-contextual-power/",
+ "Michael Nuñez": "https://venturebeat.com/author/michael_nunez/",
+ "OpenAI updates ChatGPT Search with voice queries, faster results, mobile maps integration": "https://venturebeat.com/ai/openai-updates-chatgpt-search-with-voice-queries-faster-results-mobile-maps-integration/",
+ "Google debuts new AI video generator Veo 2 claiming better audience scores than Sora": "https://venturebeat.com/ai/google-debuts-new-ai-video-generator-veo-2-claiming-better-audience-scores-than-sora/",
+ "Emilia David": "https://venturebeat.com/author/emilia-david/",
+ "See how Google Gemini 2.0 Flash can perform hours of business analysis in minutes": "https://venturebeat.com/ai/google-gemini-2-0-flash-test-drive-reveals-why-every-analyst-needs-to-know-this-modelgoogle-gemini-2-0-flash-test-drive-why-every-analyst-needs-to-know-this-model/",
+ "Louis Columbus": "https://venturebeat.com/author/louis-columbus/",
+ "We’ve come a long way from RPA: How AI agents are revolutionizing automation": "https://venturebeat.com/ai/weve-come-a-long-way-from-rpa-how-ai-agents-are-revolutionizing-automation/",
+ "Rohan Sharma, Zenolabs": "https://venturebeat.com/author/rohan-sharma-zenolabs/",
+ "Synthetic data has its limits — why human-sourced data can help prevent AI model collapse": "https://venturebeat.com/ai/synthetic-data-has-its-limits-why-human-sourced-data-can-help-prevent-ai-model-collapse/",
+ "Rick Song, Persona": "https://venturebeat.com/author/rick-song/",
+ "Cohere’s smallest, fastest R-series model excels at RAG, reasoning in 23 languages": "https://venturebeat.com/ai/coheres-smallest-fastest-r-series-model-excels-at-rag-reasoning-in-23-languages/",
+ "Taryn Plumb": "https://venturebeat.com/author/taryn-plumb/",
+ "OpenAI launches ChatGPT Projects, letting you organize files, chats in groups": "https://venturebeat.com/ai/openai-launches-chatgpt-projects-letting-you-organize-files-chats-in-groups/",
+ "Shutterstock pioneers ‘research license’ model with Lightricks, lowering barriers to AI training data": "https://venturebeat.com/ai/shutterstock-pioneers-research-license-model-with-lightricks-lowering-barriers-to-ai-training-data/",
+ "Pika 2.0 launches in wake of Sora, integrating your own characters, objects, scenes in new AI videos": "https://venturebeat.com/ai/pika-2-0-launches-in-wake-of-sora-integrating-your-own-characters-objects-scenes-in-new-ai-videos/",
+ "NotebookLM updates Business to Plus with more audio, lets all users interact with AI hosts": "https://venturebeat.com/ai/notebooklm-updates-business-to-plus-more-audio-all-users-interact-with-ai-hosts/",
+ "Microsoft’s smaller AI model beats the big guys: Meet Phi-4, the efficiency king": "https://venturebeat.com/ai/microsofts-smaller-ai-model-beats-the-big-guys-meet-phi-4-the-efficiency-king/",
+ "Nvidia": "https://venturebeat.com/author/nvidia/",
+ "Lambda launches ‘inference-as-a-service’ API claiming lowest costs in AI industry": "https://venturebeat.com/ai/lambda-launches-inference-as-a-service-api-claiming-lowest-costs/",
+ "Anthropic’s fastest model, Claude 3.5 Haiku, now generally available": "https://venturebeat.com/ai/claude-3-5-haiku-chatbot-now-generally-available/",
+ "IP Copilot wants to use AI to turn your Slack messages into patents": "https://venturebeat.com/ai/ip-copilot-wants-to-use-ai-to-turn-your-slack-messages-into-patents/",
+ "Pin thinks AI can fix recruitment’s biggest problems — and it has the numbers to prove it": "https://venturebeat.com/ai/pin-thinks-ai-can-fix-recruitments-biggest-problems-and-it-has-the-numbers-to-prove-it/",
+ "OpenAI rolls out ChatGPT for iPhone in landmark AI integration with Apple": "https://venturebeat.com/ai/openai-rolls-out-chatgpt-for-iphone-in-landmark-ai-integration-with-apple/",
+ "Midjourney is launching a multiplayer collaborative worldbuilding tool called ‘Patchwork’": "https://venturebeat.com/ai/midjourney-is-launching-a-multiplayer-collaborative-worldbuilding-tool/",
+ "‘Not there yet’: Sora rollout receives mixed response from AI filmmakers citing inconsistent results, content restrictions": "https://venturebeat.com/ai/not-there-yet-sora-rollout-receives-mixed-response-from-ai-filmmakers-citing-inconsistent-results-content-restrictions/",
+ "Google Gemini 2.0: Could this be the beginning of truly autonomous AI?": "https://venturebeat.com/ai/google-gemini-2-0-could-this-be-the-beginning-of-truly-autonomous-ai/",
+ "Google’s new Trillium AI chip delivers 4x speed and powers Gemini 2.0": "https://venturebeat.com/ai/google-new-trillium-ai-chip-delivers-4x-speed-and-powers-gemini-2-0/",
+ "Google unveils AI coding assistant ‘Jules,’ promising autonomous bug fixes and faster development cycles": "https://venturebeat.com/ai/google-unveils-ai-coding-assistant-jules-promising-autonomous-bug-fixes-and-faster-development-cycles/",
+ "Scaling AI: Platform best practices": "https://venturebeat.com/ai/scaling-ai-platform-best-practices/",
+ "Abhijit Bose, Capital One": "https://venturebeat.com/author/abhijit-bose-capital-one/",
+ "The future of AI regulation is up in the air: What’s your next move?": "https://venturebeat.com/ai/the-future-of-ai-regulation-is-up-in-the-air-whats-your-next-move/",
+ "Jen Larsen": "https://venturebeat.com/author/jenniferlarson/",
+ "Open partners with Will Smith on social commerce merch on Open SuperApp": "https://venturebeat.com/games/open-partners-with-will-smith-on-social-commerce-merch-on-open-superapp/",
+ "How RapidCanvas automates 70% of data tasks for gen AI projects": "https://venturebeat.com/data-infrastructure/how-rapidcanvas-automates-70-of-data-tasks-for-gen-ai-projects/",
+ "Shubham Sharma": "https://venturebeat.com/author/shubham-sharma/",
+ "Sapient debuts with new AI architectures, aiming to beat Transformers’ reasoning with recurrent neural networks": "https://venturebeat.com/ai/singapore-startup-sapient-enters-global-enterprise-ai-race-with-new-model-architectures/",
+ "OpenAI’s o1 model doesn’t show its thinking, giving open source an advantage": "https://venturebeat.com/ai/heres-how-openai-o1-might-lose-ground-to-open-source-models/",
+ "Ben Dickson": "https://venturebeat.com/author/ben-dickson-techtalks/",
+ "OpenAI expands ChatGPT Canvas to all users": "https://venturebeat.com/ai/openai-expands-chatgpt-canvas-to-all-users/",
+ "Realtime AI video analysis app Lloyd will offer developer kit after passing 50,000 users": "https://venturebeat.com/ai/realtime-ai-video-analysis-app-lloyd-will-offer-developer-kit-after-passing-50000-users/",
+ "ServiceNow open sources Fast-LLM in a bid to help enterprises train AI models 20% quicker": "https://venturebeat.com/ai/servicenow-open-sources-fast-llm-in-a-bid-to-help-enterprises-train-ai-models-20x-quicker/",
+ "Sean Michael Kerner": "https://venturebeat.com/author/sean-michael-kerner/",
+ "Lam Research launches collaborative robots to optimize critical maintenance in chip factories": "https://venturebeat.com/ai/lam-research-launches-collaborative-robots-to-optimize-critical-maintenance-in-chip-factories/",
+ "Solos launches AirGo Vision — ChatGPT-enabled AI smart glasses with a camera": "https://venturebeat.com/ai/solos-launches-airgo-vision-chatgpt-enabled-ai-smart-glasses-with-a-camera/",
+ "Defending SOCs Under Siege: Battling Adversarial AI Attacks": "https://venturebeat.com/security/defending-socs-battling-adversarial-attacks/",
+ "2024": "https://venturebeat.com/2024/",
+ "Jan": "https://venturebeat.com/2014/01/",
+ "Feb": "https://venturebeat.com/2014/02/",
+ "Mar": "https://venturebeat.com/2014/03/",
+ "Apr": "https://venturebeat.com/2014/04/",
+ "May": "https://venturebeat.com/2014/05/",
+ "Jun": "https://venturebeat.com/2014/06/",
+ "Jul": "https://venturebeat.com/2014/07/",
+ "Aug": "https://venturebeat.com/2014/08/",
+ "Sep": "https://venturebeat.com/2014/09/",
+ "Oct": "https://venturebeat.com/2014/10/",
+ "Nov": "https://venturebeat.com/2014/11/",
+ "Dec": "https://venturebeat.com/2014/12/",
+ "2023": "https://venturebeat.com/2023/",
+ "2022": "https://venturebeat.com/2022/",
+ "2021": "https://venturebeat.com/2021/",
+ "2020": "https://venturebeat.com/2020/",
+ "2019": "https://venturebeat.com/2019/",
+ "2018": "https://venturebeat.com/2018/",
+ "2017": "https://venturebeat.com/2017/",
+ "2016": "https://venturebeat.com/2016/",
+ "2015": "https://venturebeat.com/2015/",
+ "2014": "https://venturebeat.com/2014/",
+ "Follow us on Facebook": "https://www.facebook.com/venturebeat/",
+ "Follow us on X": "https://twitter.com/venturebeat",
+ "Follow us on LinkedIn": "https://www.linkedin.com/company/venturebeat",
+ "Follow us on RSS": "https://feeds.feedburner.com/venturebeat/SZYF",
+ "Press Releases": "https://venturebeat.com/tag/business-sponsored-company-news/",
+ "Contact Us": "https://venturebeat.com/contact/",
+ "Advertise": "https://media.venturebeat.com/",
+ "Contribute to DataDecisionMakers": "https://venturebeat.com/guest-posts/",
+ "Privacy Policy": "https://venturebeat.com/privacy-policy/",
+ "Terms of Service": "https://venturebeat.com/terms-of-service/",
+ "VentureBeat": "https://venturebeat.com/"
+}
\ No newline at end of file
diff --git a/test/webpage_samples/_task2/ae77d4/screenshot.jpg b/test/webpage_samples/_task2/ae77d4/screenshot.jpg
new file mode 100644
index 0000000..a9d7276
Binary files /dev/null and b/test/webpage_samples/_task2/ae77d4/screenshot.jpg differ
diff --git a/test/webpage_samples/_task2/ae77d4/text.txt b/test/webpage_samples/_task2/ae77d4/text.txt
new file mode 100644
index 0000000..9000e51
--- /dev/null
+++ b/test/webpage_samples/_task2/ae77d4/text.txt
@@ -0,0 +1,114 @@
+Skip to main content
+Events
+Video
+Special Issues
+Jobs
+Subscribe
+Artificial Intelligence
+Security
+Data Infrastructure
+Automation
+Enterprise Analytics
+More
+AI
+Gemini 2.0 Flash ushers in a new era of real-time multimodal AI
+Nvidia unveils next-gen AI and industrial digitalization capabilities at Microsoft Ignite
+New LLM optimization technique slashes memory costs up to 75%
+Geopolitics and AI will affect the chip industry in 2025 | KPMG
+Dean Takahashi December 16, 2024 9:00 PM
+MidJourney adds Pinterest-like ‘moodboards’ and support for multiple custom AI image models
+Carl Franzen December 16, 2024 2:16 PM
+EXCLUSIVE
+Slack’s AI agents promise to reshape productivity with contextual power
+Michael Nuñez December 16, 2024 1:26 PM
+OpenAI updates ChatGPT Search with voice queries, faster results, mobile maps integration
+Carl Franzen December 16, 2024 10:42 AM
+Google debuts new AI video generator Veo 2 claiming better audience scores than Sora
+Emilia David December 16, 2024 9:24 AM
+ANALYSIS
+See how Google Gemini 2.0 Flash can perform hours of business analysis in minutes
+Louis Columbus December 16, 2024 7:17 AM
+GUEST
+We’ve come a long way from RPA: How AI agents are revolutionizing automation
+Rohan Sharma, Zenolabs December 15, 2024 4:15 PM
+GUEST
+Synthetic data has its limits — why human-sourced data can help prevent AI model collapse
+Rick Song, Persona December 14, 2024 12:05 PM
+Cohere’s smallest, fastest R-series model excels at RAG, reasoning in 23 languages
+Taryn Plumb December 13, 2024 4:27 PM
+OpenAI launches ChatGPT Projects, letting you organize files, chats in groups
+Emilia David December 13, 2024 1:56 PM
+Shutterstock pioneers ‘research license’ model with Lightricks, lowering barriers to AI training data
+Michael Nuñez December 13, 2024 11:11 AM
+Pika 2.0 launches in wake of Sora, integrating your own characters, objects, scenes in new AI videos
+Carl Franzen December 13, 2024 10:53 AM
+NotebookLM updates Business to Plus with more audio, lets all users interact with AI hosts
+Emilia David December 13, 2024 9:09 AM
+Microsoft’s smaller AI model beats the big guys: Meet Phi-4, the efficiency king
+Michael Nuñez December 12, 2024 5:10 PM
+VB LAB INSIGHTS
+Nvidia unveils next-gen AI and industrial digitalization capabilities at Microsoft Ignite
+Nvidia December 12, 2024 1:08 PM
+EXCLUSIVE
+Lambda launches ‘inference-as-a-service’ API claiming lowest costs in AI industry
+Carl Franzen December 12, 2024 11:19 AM
+Anthropic’s fastest model, Claude 3.5 Haiku, now generally available
+Carl Franzen December 12, 2024 8:40 AM
+EXCLUSIVE
+IP Copilot wants to use AI to turn your Slack messages into patents
+Michael Nuñez December 12, 2024 6:00 AM
+EXCLUSIVE
+Pin thinks AI can fix recruitment’s biggest problems — and it has the numbers to prove it
+Michael Nuñez December 12, 2024 3:00 AM
+OpenAI rolls out ChatGPT for iPhone in landmark AI integration with Apple
+Michael Nuñez December 11, 2024 1:54 PM
+Midjourney is launching a multiplayer collaborative worldbuilding tool called ‘Patchwork’
+Carl Franzen December 11, 2024 11:58 AM
+‘Not there yet’: Sora rollout receives mixed response from AI filmmakers citing inconsistent results, content restrictions
+Carl Franzen December 11, 2024 8:10 AM
+Google Gemini 2.0: Could this be the beginning of truly autonomous AI?
+Michael Nuñez December 11, 2024 7:30 AM
+Google’s new Trillium AI chip delivers 4x speed and powers Gemini 2.0
+Michael Nuñez December 11, 2024 7:30 AM
+Google unveils AI coding assistant ‘Jules,’ promising autonomous bug fixes and faster development cycles
+Michael Nuñez December 11, 2024 7:29 AM
+VB LAB INSIGHTS
+Scaling AI: Platform best practices
+Abhijit Bose, Capital One December 11, 2024 7:08 AM
+VB EVENT
+The future of AI regulation is up in the air: What’s your next move?
+Jen Larsen December 11, 2024 6:44 AM
+Open partners with Will Smith on social commerce merch on Open SuperApp
+Dean Takahashi December 11, 2024 6:30 AM
+EXCLUSIVE
+How RapidCanvas automates 70% of data tasks for gen AI projects
+Shubham Sharma December 11, 2024 5:00 AM
+EXCLUSIVE
+Sapient debuts with new AI architectures, aiming to beat Transformers’ reasoning with recurrent neural networks
+Carl Franzen December 10, 2024 3:09 PM
+OpenAI’s o1 model doesn’t show its thinking, giving open source an advantage
+Ben Dickson December 10, 2024 3:09 PM
+OpenAI expands ChatGPT Canvas to all users
+Emilia David December 10, 2024 12:17 PM
+Realtime AI video analysis app Lloyd will offer developer kit after passing 50,000 users
+Carl Franzen December 10, 2024 12:06 PM
+ServiceNow open sources Fast-LLM in a bid to help enterprises train AI models 20% quicker
+Sean Michael Kerner December 10, 2024 6:00 AM
+Lam Research launches collaborative robots to optimize critical maintenance in chip factories
+Dean Takahashi December 10, 2024 6:00 AM
+Solos launches AirGo Vision — ChatGPT-enabled AI smart glasses with a camera
+Dean Takahashi December 10, 2024 6:00 AM
+FEATURE
+Defending SOCs Under Siege: Battling Adversarial AI Attacks
+Louis Columbus December 9, 2024 12:07 PM
+Load more articles
+Press Releases
+Contact Us
+Advertise
+Share a News Tip
+Contribute to DataDecisionMakers
+Privacy Policy
+Terms of Service
+Do Not Sell My Personal Information
+
+© 2024 VentureBeat. All rights reserved.
\ No newline at end of file
diff --git a/test/webpage_samples/_task2/e8c97c/link_dict.json b/test/webpage_samples/_task2/e8c97c/link_dict.json
new file mode 100644
index 0000000..c702a03
--- /dev/null
+++ b/test/webpage_samples/_task2/e8c97c/link_dict.json
@@ -0,0 +1,169 @@
+{
+ "账号设置": "https://36kr.com/usercenter/account-password",
+ "我的关注": "https://36kr.com/usercenter/follow",
+ "我的收藏": "https://36kr.com/usercenter/favorite",
+ "申请的报道": "https://36kr.com/seek-report-new?tabKey=2",
+ "36氪Auto": "https://img.36krcdn.com/hsossms/20230605/v2_384be8e4c1e942a28cf13a2e427fe211@18900718_oswg78404oswg320oswg320_img_png",
+ "数字时氪": "https://img.36krcdn.com/hsossms/20230605/v2_636063907bdc44389b46e7db9c761a38@18900718_oswg62424oswg320oswg320_img_png",
+ "未来消费": "https://img.36krcdn.com/hsossms/20230210/v2_38d1cdabc8404b00806de58cbedb3b7b_oswg27031oswg320oswg320_img_png",
+ "智能涌现": "https://img.36krcdn.com/hsossms/20230605/v2_da74c43ba887426f8fbccaede691b844@18900718_oswg76573oswg320oswg320_img_png",
+ "未来城市": "https://img.36krcdn.com/hsossms/20230209/v2_8c2233c88a854c6496ff4f7842a9f9dd_oswg17629oswg320oswg320_img_png",
+ "启动Power on": "https://img.36krcdn.com/hsossms/20230605/v2_632f36f1c5904a539a1e57efe4497e3a@18900718_oswg63630oswg320oswg320_img_png",
+ "36氪出海": "https://36kr.com/user/11918142",
+ "36氪研究院": "https://img.36krcdn.com/hsossms/20230605/v2_89fa42090fae495ca5e45ba921ee42ff@18900718_oswg65306oswg320oswg320_img_png",
+ "潮生TIDE": "https://img.36krcdn.com/hsossms/20231204/v2_3b8447ffdda24a38a30fd839fd934baa@000000_oswg40121oswg430oswg430_img_jpeg",
+ "36氪企服点评": "https://img.36krcdn.com/hsossms/20230605/v2_c4720503500642d294b5be04064ef870@18900718_oswg58529oswg320oswg320_img_png",
+ "36氪财经": "https://img.36krcdn.com/hsossms/20230209/v2_d6d3f8b57fa04507915c48adf0f9620d_oswg16586oswg320oswg320_img_png",
+ "职场bonus": "https://img.36krcdn.com/hsossms/20230605/v2_efc94b0cce7043dbac883c1dfe00c810@18900718_oswg57046oswg320oswg320_img_png",
+ "36碳": "https://img.36krcdn.com/hsossms/20230209/v2_9eb02027be264174b61b9d49c391ca75_oswg15571oswg320oswg320_img_png",
+ "后浪研究所": "https://img.36krcdn.com/hsossms/20230605/v2_86f220b69e164751946d583b5472c857@18900718_oswg97988oswg320oswg320_img_png",
+ "暗涌Waves": "https://img.36krcdn.com/hsossms/20230209/v2_0c6a697748b54beea356d6e1f1fcec5f_oswg17066oswg320oswg320_img_png",
+ "硬氪": "https://img.36krcdn.com/hsossms/20230209/v2_2f845ed16244458d8887a5526c63c6d6_oswg17346oswg320oswg320_img_png",
+ "企业号": "https://36kr.com/information/qiyehao/",
+ "企服点评": "https://www.36dianping.com/",
+ "36Kr研究院": "https://36kr.com/academe",
+ "36Kr创新咨询": "https://innovation.36kr.com",
+ "核心服务": "https://www.36kr.com/p/2492318105786505",
+ "城市之窗": "https://36kr.com/policy",
+ "创投发布": "https://topics.36kr.com/topic/1645523444931974",
+ "LP源计划": "https://36kr.com/LPlan",
+ "VClub": "https://36kr.com/VClub",
+ "VClub投资机构库": "https://36kr.com/organization/",
+ "投资机构职位推介": "https://36kr.com/topics/1620276089894403",
+ "投资人认证": "https://pitchhub.36kr.com/audit-investor",
+ "寻求报道": "https://36kr.com/seek-report-new",
+ "36氪Pro": "https://img.36krcdn.com/hsossms/20230209/v2_95565530d4d94dc4ad904f3131c7b690_oswg23055oswg320oswg320_img_png",
+ "创投氪堂": "https://topics.36kr.com/topic/1961250130199045",
+ "企业入驻": "https://36kr.com/project-form/settled",
+ "首页": "https://36kr.com/",
+ "快讯": "https://36kr.com/newsflashes/",
+ "资讯": "https://36kr.com/information/web_news/",
+ "推荐": "https://36kr.com/information/web_recommend",
+ "财经": "https://36kr.com/information/ccs/",
+ "AI": "https://36kr.com/information/AI/",
+ "自助报道": "https://36kr.com/information/aireport/",
+ "浙江": "https://36kr.com/local/zhejiang",
+ "最新": "https://36kr.com/information/web_news/latest/",
+ "创投": "https://36kr.com/information/contact/",
+ "汽车": "https://36kr.com/information/travel",
+ "科技": "https://36kr.com/information/technology",
+ "专精特新": "https://36kr.com/information/shuzihua/",
+ "直播": "https://36kr.com/live/channel",
+ "视频": "https://36kr.com/video/",
+ "专题": "https://36kr.com/topics/",
+ "活动": "https://36kr.com/activity",
+ "广东": "https://36kr.com/local/guangdong",
+ "江苏": "https://36kr.com/local/jiangsu",
+ "四川": "https://36kr.com/local/sichuan",
+ "河南": "https://36kr.com/local/henan",
+ "湖北": "https://36kr.com/local/hubei",
+ "安徽": "https://36kr.com/local/anhui",
+ "海南": "https://36kr.com/local/hainan",
+ "陕西": "https://36kr.com/local/xian",
+ "重庆": "https://36kr.com/local/chongqing",
+ "山东": "https://36kr.com/local/qingdao",
+ "湖南": "https://36kr.com/local/hunan",
+ "贵州": "https://36kr.com/local/guizhou",
+ "城市合作": "https://36kr.com/station-business",
+ "创新": "https://36kr.com/information/innovate/",
+ "企服": "https://36kr.com/information/enterpriseservice/",
+ "消费": "https://36kr.com/information/happy_life",
+ "城市": "https://36kr.com/information/real_estate/",
+ "职场": "https://36kr.com/information/web_zhichang",
+ "红人": "https://36kr.com/information/sensation/",
+ "其他": "https://36kr.com/information/other/",
+ "医美这个“浑水”:美团“趟”的姿势对吗?": "https://36kr.com/p/3082527849478278",
+ "王兴与美团": "https://36kr.com/motif/327686340609",
+ "互联网江湖": "https://36kr.com/user/158547",
+ "谷歌发了个新模型,顺手证明Sora才是最菜的": "https://36kr.com/p/3082527741917577",
+ "人工智能·AI": "https://36kr.com/motif/327686782977",
+ "36氪的朋友们": "https://36kr.com/user/375349",
+ "CTO“互跳”背后,国货美妆研发迭代提速": "https://36kr.com/p/3082517596110340",
+ "关于消费的一切": "https://36kr.com/motif/327685832705",
+ "未来迹FBeauty": "https://36kr.com/user/5728075",
+ "极越CEO夏一平发长文道歉,随后又悄悄删掉……": "https://36kr.com/p/3082516985641344",
+ "汽车出行": "https://36kr.com/motif/327687127041",
+ "智东西": "https://36kr.com/user/453363432",
+ "大疆自动驾驶,获中国销量TOP 2车企同时入股": "https://36kr.com/p/3082506448976256",
+ "智能车参考": "https://36kr.com/user/5507103",
+ "24万“AI民工”血汗,哺出一个95后亿万富豪": "https://36kr.com/p/3082789740673414",
+ "硅谷前沿资讯": "https://36kr.com/motif/327687520257",
+ "ChatGPT搜索,全球免费,Her动嘴实时搜,暴打谷歌边聊边搜": "https://36kr.com/p/3082498003761536",
+ "新智元": "https://36kr.com/user/574825230",
+ "8万元买个“碗”,有年轻人,靠“修仙”暴富了?": "https://36kr.com/p/3082486369122696",
+ "正解局": "https://36kr.com/user/19903073",
+ "从设计师的角度,聊聊我眼中的 Apple Watch": "https://36kr.com/p/3082481593776259",
+ "王者苹果?": "https://36kr.com/motif/327686176769",
+ "少数派": "https://36kr.com/user/569821167",
+ "74亿,阿里巴巴出售银泰百货": "https://36kr.com/p/3082477692632576",
+ "阿里的疆域": "https://36kr.com/motif/327686094849",
+ "联商网": "https://36kr.com/user/5389615",
+ "半年狂赚46亿,富二代创业拿捏中产,“最和睦富豪家族”正有序接班?": "https://36kr.com/p/3082466745907593",
+ "创投圈秘事": "https://36kr.com/motif/1654014377589128",
+ "金融八卦女": "https://36kr.com/user/5952300",
+ "迈凯伦又被卖了,这次出手的是蔚来第一大股东": "https://36kr.com/p/3082509185005952",
+ "爱范儿": "https://36kr.com/user/16637033",
+ "私域运营深度解析:6大策略提升客户生命周期价值": "https://36kr.com/p/3082434740813574",
+ "运营须知手册": "https://36kr.com/motif/327686438913",
+ "丰宪飞": "https://36kr.com/user/1984794148",
+ "我在东南亚卖茶饮,200万“重注”霸王茶姬": "https://36kr.com/p/3082431621398272",
+ "温度纪": "https://36kr.com/user/5237149",
+ "谈谈人工智能时代的数据战略": "https://36kr.com/p/3082400738130307",
+ "王建峰": "https://36kr.com/user/5814876",
+ "探秘虚拟消费:2024游戏及网络服务行业营销趋势洞察": "https://36kr.com/p/3082362389741057",
+ "游戏圈大事件": "https://36kr.com/motif/327687553025",
+ "增长黑盒": "https://36kr.com/user/5894234",
+ "赌上一切的李彦宏可能真要赢?": "https://36kr.com/p/3081146190511624",
+ "争议下的百度": "https://36kr.com/motif/327686111233",
+ "BT财经": "https://36kr.com/user/5131460",
+ "氪星晚报 | 贵州茅台:回购股份前期工作即将完成;蚂蚁集团1亿在上海成立科技公司,含多项AI业务;蜜雪冰城回应多个城市门店涨价:运营成本变化": "https://36kr.com/p/3082795042453640",
+ "早晚报": "https://36kr.com/motif/327685521409",
+ "卜算籽": "https://36kr.com/user/5724308",
+ "出海速递|特朗普会见TikTok CEO周受资/中国短剧出海刺激日本龙头入局": "https://36kr.com/p/3082709770336645",
+ "出海是门大生意": "https://36kr.com/motif/327687405569",
+ "「先享后付」暗藏陷阱,线下消费该如何避坑?": "https://36kr.com/p/3082745274908417",
+ "雷科技": "https://36kr.com/user/1547419282",
+ "增程2.0时代:小米、小鹏入场,谁能领跑增程下半场": "https://36kr.com/p/3081576353677058",
+ "新造车势力又搞事": "https://36kr.com/motif/327685996545",
+ "HiEV": "https://36kr.com/user/5719300",
+ "学校新来的AI体育老师,量身定制每天1小时最合理运动计划": "https://36kr.com/p/3082776912591235",
+ "时氪分享": "https://36kr.com/user/354993",
+ "职场每日必读": "https://36kr.com/motif/327686520833",
+ "瞎说职场": "https://36kr.com/user/1993786828",
+ "茶饮界的「小镇王者」,再战港交所": "https://36kr.com/p/3082754962503808",
+ "港股": "https://36kr.com/motif/887345179633929",
+ "凤凰网科技": "https://36kr.com/user/1883322323",
+ "AI+玩偶:是儿童市场的新风口,还是智能硬件的老泡沫?": "https://36kr.com/p/3082747890153609",
+ "深响": "https://36kr.com/user/909678552",
+ "半月暴涨3万亿,资金正疯狂涌入": "https://36kr.com/p/3082704821467528",
+ "格隆汇": "https://36kr.com/user/727315692",
+ "谁为AI事故负责?": "https://36kr.com/p/3082707205126531",
+ "腾讯研究院": "https://36kr.com/user/108218233",
+ "特斯拉新车遭遇重大自动驾驶系统问题,极氪7X登陆欧洲市场|海外日报": "https://36kr.com/p/3082752368654467",
+ "行业日报": "https://36kr.com/motif/1856406379189897",
+ "EV Focus 日报": "https://36kr.com/user/6130289",
+ "狂砸8000亿的“烧钱巨兽”,在全球整容成功": "https://36kr.com/p/3082718051088770",
+ "互联网新鲜事": "https://36kr.com/motif/327689814017",
+ "金错刀": "https://36kr.com/user/19499439",
+ "这一轮地铁建设,谁是赢家": "https://36kr.com/p/3082720871479430",
+ "城市风向标": "https://36kr.com/motif/1042447708897025",
+ "时代周报": "https://36kr.com/user/5258135",
+ "如视数字空间综合解决方案引领者": "https://36kr.com/user/6004667",
+ "查看更多企业": "https://36kr.com/enterprises-list",
+ "投资者关系": "http://ir.36kr.com",
+ "关于我们": "https://36kr.com/pages/about",
+ "加入我们": "https://zhaopin.36kr.com",
+ "36氪欧洲站": "https://eu.36kr.com/de",
+ "Ai产品日报": "https://www.aicpb.com",
+ "网络谣言信息举报入口": "https://36kr.com/refute-rumor-notice",
+ "热门资讯": "https://36kr.com/hot-list/catalog",
+ "热门产品": "https://36kr.com/project",
+ "文章标签": "https://36kr.com/tags",
+ "快讯标签": "https://36kr.com/nftags",
+ "阿里云": "https://www.aliyun.com/",
+ "网上有害信息举报": "https://www.12377.cn",
+ "京ICP备12031756号-6": "https://beian.miit.gov.cn/#/Integrated/index",
+ "京ICP证150143号": "https://dxzhgl.miit.gov.cn/dxxzsp/xkz/xkzgl/resource/qiyesearch.jsp?num=%25E5%258C%2597%25E4%25BA%25AC%25E5%25A4%259A%25E6%25B0%25AA%25E4%25BF%25A1%25E6%2581%25AF%25E7%25A7%2591%25E6%258A%2580%25E6%259C%2589%25E9%2599%2590%25E5%2585%25AC%25E5%258F%25B8&type=xuke",
+ "京公网安备11010502036099号": "http://www.beian.gov.cn/portal/registerSystemInfo?recordcode=11010502036099",
+ "意见反馈": "https://36kr.com/mform/1755983296602372"
+}
\ No newline at end of file
diff --git a/test/webpage_samples/_task2/e8c97c/screenshot.jpg b/test/webpage_samples/_task2/e8c97c/screenshot.jpg
new file mode 100644
index 0000000..66ad5fc
Binary files /dev/null and b/test/webpage_samples/_task2/e8c97c/screenshot.jpg differ
diff --git a/test/webpage_samples/_task2/e8c97c/text.txt b/test/webpage_samples/_task2/e8c97c/text.txt
new file mode 100644
index 0000000..18aca02
--- /dev/null
+++ b/test/webpage_samples/_task2/e8c97c/text.txt
@@ -0,0 +1,317 @@
+登录
+搜索
+36氪Auto
+数字时氪
+未来消费
+智能涌现
+未来城市
+启动Power on
+36氪出海
+36氪研究院
+潮生TIDE
+36氪企服点评
+36氪财经
+职场bonus
+36碳
+后浪研究所
+暗涌Waves
+硬氪
+媒体品牌
+企业号
+企服点评
+36Kr研究院
+36Kr创新咨询
+企业服务
+核心服务
+城市之窗
+政府服务
+创投发布
+LP源计划
+VClub
+VClub投资机构库
+投资机构职位推介
+投资人认证
+投资人服务
+寻求报道
+36氪Pro
+创投氪堂
+企业入驻
+创业者服务
+创投平台
+首页
+快讯
+资讯
+推荐
+财经
+AI
+自助报道
+浙江
+最新
+创投
+汽车
+科技
+专精特新
+直播
+视频
+专题
+活动
+搜索
+寻求报道
+我要入驻
+城市合作
+最新
+推荐
+创投
+财经
+汽车
+AI
+科技
+自助报道
+专精特新
+创新
+企服
+消费
+城市
+职场
+企业号
+红人
+其他
+科技
+
+医美这个“浑水”:美团“趟”的姿势对吗?
+
+美团医美:屠龙少年还是恶龙?
+来自主题:王兴与美团|互联网江湖
+8分钟前
+科技
+
+谷歌发了个新模型,顺手证明Sora才是最菜的
+
+看来,在这场AI战争中,还有的是逆转的好戏。
+来自主题:人工智能·AI|36氪的朋友们
+17分钟前
+推荐
+
+CTO“互跳”背后,国货美妆研发迭代提速
+
+系统性思维
+来自主题:关于消费的一切|未来迹FBeauty
+32分钟前
+汽车
+
+极越CEO夏一平发长文道歉,随后又悄悄删掉……
+
+百度、吉利为老车主兜底。
+来自主题:汽车出行|智东西
+33分钟前
+科技
+
+大疆自动驾驶,获中国销量TOP 2车企同时入股
+
+“量产10万级智能车”
+来自主题:人工智能·AI|智能车参考
+33分钟前
+科技
+
+24万“AI民工”血汗,哺出一个95后亿万富豪
+
+华人AI数据标注独角兽陷用工争议。
+来自主题:硅谷前沿资讯|智东西
+34分钟前
+科技
+
+ChatGPT搜索,全球免费,Her动嘴实时搜,暴打谷歌边聊边搜
+
+ChatGPT搜索功能,全球免费用户可用了!更令人惊喜的是,搜索将集成到Her中,可以让我们实时通话进行搜索。
+来自主题:人工智能·AI|新智元
+35分钟前
+推荐
+
+8万元买个“碗”,有年轻人,靠“修仙”暴富了?
+
+七天学费一万元,“玄学灰产”突然火起来了?
+来自主题:关于消费的一切|正解局
+36分钟前
+科技
+
+从设计师的角度,聊聊我眼中的 Apple Watch
+
+从设计师视角聊聊 Apple Watch
+来自主题:王者苹果?|少数派
+39分钟前
+科技
+
+74亿,阿里巴巴出售银泰百货
+
+银泰百货缩水近百亿。
+来自主题:阿里的疆域|联商网
+39分钟前
+科技
+
+半年狂赚46亿,富二代创业拿捏中产,“最和睦富豪家族”正有序接班?
+
+这个地方真的“盛产霸总”。
+来自主题:创投圈秘事|金融八卦女
+40分钟前
+汽车
+
+迈凯伦又被卖了,这次出手的是蔚来第一大股东
+
+造 SUV,是超跑品牌的唯一出路。
+来自主题:汽车出行|爱范儿
+41分钟前
+职场
+
+私域运营深度解析:6大策略提升客户生命周期价值
+
+私域运营的3个段位,你处在哪个段位呢?
+来自主题:运营须知手册|丰宪飞
+42分钟前
+推荐
+
+我在东南亚卖茶饮,200万“重注”霸王茶姬
+
+普通人加盟茶饮难“成角儿”
+来自主题:关于消费的一切|温度纪
+43分钟前
+科技
+
+谈谈人工智能时代的数据战略
+
+谈谈人工智能时代的数据战略
+来自主题:人工智能·AI|王建峰
+43分钟前
+消费
+
+探秘虚拟消费:2024游戏及网络服务行业营销趋势洞察
+
+借助内容创意撬动用户增长的杠杆?
+来自主题:游戏圈大事件|增长黑盒
+45分钟前
+科技
+
+赌上一切的李彦宏可能真要赢?
+
+大模型企业到了见真章的时候,赌上一切的李彦宏可能真要赢?
+来自主题:争议下的百度|BT财经
+51分钟前
+推荐
+
+氪星晚报 | 贵州茅台:回购股份前期工作即将完成;蚂蚁集团1亿在上海成立科技公司,含多项AI业务;蜜雪冰城回应多个城市门店涨价:运营成本变化
+
+软银正在围绕PayPay重组其集团金融服务;奇瑞汽车1650万成立新科技公司,含太阳能发电技术服务业务;OPPO申请一键问屏商标
+来自主题:早晚报|卜算籽
+52分钟前
+推荐
+
+出海速递|特朗普会见TikTok CEO周受资/中国短剧出海刺激日本龙头入局
+
+查阅更多出海好文章,请移步出海官网 letschuhai.com。
+来自主题:出海是门大生意|36氪出海
+1小时前
+推荐
+
+「先享后付」暗藏陷阱,线下消费该如何避坑?
+
+最好的避坑方法就是不要提前消费。
+来自主题:关于消费的一切|雷科技
+1小时前
+汽车
+
+增程2.0时代:小米、小鹏入场,谁能领跑增程下半场
+
+头部车企集体拥抱增程。
+来自主题:新造车势力又搞事|HiEV
+1小时前
+科技
+
+学校新来的AI体育老师,量身定制每天1小时最合理运动计划
+
+宇视科技AI文教体:为孩子、为明天、为未来。
+来自主题:人工智能·AI|时氪分享
+1小时前
+职场
+
+面试后为什么HR不给回复?
+
+如果面试没通过,HR就直说就好,为啥「装聋作哑」呢?
+来自主题:职场每日必读|瞎说职场
+1小时前
+推荐
+
+茶饮界的「小镇王者」,再战港交所
+
+茶饮新贵上市潮要来了?
+来自主题:港股|凤凰网科技
+1小时前
+科技
+
+AI+玩偶:是儿童市场的新风口,还是智能硬件的老泡沫?
+
+门槛不高、玩家众多,尚有广阔空白市场。
+来自主题:人工智能·AI|深响
+1小时前
+科技
+
+半月暴涨3万亿,资金正疯狂涌入
+
+又一个黑科技即将爆发?
+来自主题:人工智能·AI|格隆汇
+1小时前
+科技
+
+谁为AI事故负责?
+
+AI时代,侵权责任制度往何处去?
+来自主题:人工智能·AI|腾讯研究院
+1小时前
+推荐
+
+特斯拉新车遭遇重大自动驾驶系统问题,极氪7X登陆欧洲市场|海外日报
+
+12 月 17 日 EV Focus 海外日报
+来自主题:行业日报|EV Focus 日报
+1小时前
+科技
+
+狂砸8000亿的“烧钱巨兽”,在全球整容成功
+
+烧钱巨兽,彻底赚回脸面
+来自主题:互联网新鲜事|金错刀
+1小时前
+
+这一轮地铁建设,谁是赢家
+
+郑州苏州,增量明显
+来自主题:城市风向标|时代周报
+1小时前
+查看更多
+推荐企业
+换一换
+如视
+数字空间综合解决方案引领者
+查看更多企业
+关于36氪
+城市合作
+寻求报道
+我要入驻
+投资者关系
+商务合作
+关于我们
+联系我们
+加入我们
+36氪欧洲站
+36氪欧洲站
+36氪欧洲站
+Ai产品日报
+网络谣言信息举报入口
+热门推荐
+热门资讯
+热门产品
+文章标签
+快讯标签
+合作伙伴
+36氪APP下载
+iOS & Android
+本站由 阿里云 提供计算与安全服务 违法和不良信息、未成年人保护举报电话:010-89650707 举报邮箱:jubao@36kr.com 网上有害信息举报
+© 2011~2024 北京多氪信息科技有限公司 | 京ICP备12031756号-6 | 京ICP证150143号 | 京公网安备11010502036099号
\ No newline at end of file
diff --git a/test/webpage_samples/_task2/focus_point.json b/test/webpage_samples/_task2/focus_point.json
new file mode 100644
index 0000000..1298526
--- /dev/null
+++ b/test/webpage_samples/_task2/focus_point.json
@@ -0,0 +1,7 @@
+[{"focuspoint": "大模型技术突破与创新", "explanation": "包括新算法与模型,新的研究成果"},
+{"focuspoint": "AI应用市场规模与增长预测", "explanation": "提供AI市场的最新统计数据、增长趋势和未来预测,帮助读者了解行业发展方向的信息"},
+{"focuspoint": "大模型落地行业应用趋势", "explanation": "分析大模型在各个行业(如医疗、金融、制造、教育)的应用现状和发展前景,展示AI在实际业务中的价值。"},
+{"focuspoint": "大模型企业应用案例", "explanation": "分享企业如何利用大模型提升效率、降低成本或创新产品的具体案例,展示AI的实际效益。"},
+{"focuspoint": "大模型创业故事", "explanation": "介绍大模型初创公司的发展历程、融资情况和成功经验,激励创业者和投资者。"},
+{"focuspoint": "好用的AI工具及其适用的范围,和同类型工具的对比", "explanation": ""}
+]
\ No newline at end of file
diff --git a/test/webpage_samples/_task2/record-2024-12-18-20-01-50.txt b/test/webpage_samples/_task2/record-2024-12-18-20-01-50.txt
new file mode 100644
index 0000000..73ca206
--- /dev/null
+++ b/test/webpage_samples/_task2/record-2024-12-18-20-01-50.txt
@@ -0,0 +1,1361 @@
+focus statement: #大模型技术突破与创新
+解释:包括新算法与模型,新的研究成果
+#AI应用市场规模与增长预测
+解释:提供AI市场的最新统计数据、增长趋势和未来预测,帮助读者了解行业发展方向的信息
+#大模型落地行业应用趋势
+解释:分析大模型在各个行业(如医疗、金融、制造、教育)的应用现状和发展前景,展示AI在实际业务中的价值。
+#大模型企业应用案例
+解释:分享企业如何利用大模型提升效率、降低成本或创新产品的具体案例,展示AI的实际效益。
+#大模型创业故事
+解释:介绍大模型初创公司的发展历程、融资情况和成功经验,激励创业者和投资者。
+#好用的AI工具及其适用的范围,和同类型工具的对比
+
+
+raw materials: 9c76f8
+
+llm model: Qwen/Qwen2.5-7B-Instruct
+hallucination times: 5
+total analysis time: 3.216700792312622
+
+author and publish time(not formated): {'source': 'NA', 'publish_date': 'NA'}
+infos(not formated):
+
+more urls:
+
+
+************
+
+llm model: THUDM/glm-4-9b-chat
+hallucination times: 1
+total analysis time: 21.37568473815918
+
+author and publish time(not formated): {'source': 'NA', 'publish_date': 'NA'}
+infos(not formated):
+#大模型技术突破与创新: InsightFace not using GPU [closed] I am building a face recognition system. I have Nvidia 1660 6GB super installed. I have written all the code. But it is not using GPU. On CPU, it is very slow. I have tried multiple versions of Nvidia ... deep-learning cuda artificial-intelligence face-recognition onnxruntime Khawar Ali1 asked 22 hours ago
+#AI应用市场规模与增长预测: None
+#大模型落地行业应用趋势: None
+#大模型企业应用案例: None
+#大模型创业故事: None
+好用的AI工具及其适用的范围,和同类型工具的对比: How to use chatgpt for reviewing and analizing my Oracle database [closed] I frequently use ChatGPT for various tasks such as writing documents, developing SQL queries, programming functions, and more. However, I would like to utilize ChatGPT specifically to analyze some ... artificial-intelligence chatgpt-apichat-gpt-4 Delmonte403 asked 20 hours ago
+大模型技术突破与创新: How to Improve CNN Model Performance for Image Classification in PyTorch? I am working on an image classification project using PyTorch and have implemented a Convolutional Neural Network (CNN) model. While the model is functional, I am looking for ways to improve its ...
+大模型技术突破与创新: Contrastive Loss from ScratchI am trying to implement/learn how to implement contrastive loss. Currently my gradients are exploding into infinity and I think I must have misimplemented something. I was wondering if someone could ...
+大模型技术突破与创新: Where can I find datasets for medical document analysis and disease diagnosis using NLP? I'm working on a healthcare-related project where I need to analyze medical documents, extract specific values (e.g., creatinine, glucose levels, etc.), and generate personalized paragraphs for ...
+大模型技术突破与创新: Error: "Vectors must have the same length as the number of dimensions" when adding documents to FAISS vector store in LangChain
+大模型技术突破与创新: I'm trying to embed and store documents in a FAISS vector store using LangChain, but I'm encountering the error: Vectors must have the same length as the number of dimensions I'm using a locally ...
+AI应用市场规模与增长预测: None
+大模型落地行业应用趋势: None
+大模型企业应用案例: None
+大模型创业故事: None
+好用的AI工具及其适用的范围,和同类型工具的对比: I'm trying to find a way to classify images based on their aptitude to be printed on clothing, ideally using a python library. The main thing I'm trying to do is find text size and color and general ...
+好用的AI工具及其适用的范围,和同类型工具的对比: VS code extension that uses OpenAI API doens't workI want to write a simple VS Code extension that calls OpenAI API and tells the user the day in Danish. I cannot find the extension when searching for it in the Extension Development Host window (after ...
+#大模型技术突破与创新: The Overflow BlogAI agents that help doctors get paidLegal advice from an AI is illegalFeatured on MetaThe December 2024 Community Asks Sprint has been moved to March 2025 (and...Stack Overflow Jobs is expanding to more countries
+more urls:
+computer-vision
+Blog
+langchain
+tensorflow
+c#
+Why are languages commonly structured as trees?
+Twitter
+a-star
+No module named 'ppaquette_gym_doom'
+CC BY-SA
+Science
+large-language-model
+About the company
+InsightFace not using GPU [closed]
+Contrastive Loss from Scratch
+minimax
+AI agents that help doctors get paid
+Data
+search
+Newest artificial-intelligence questions feed
+keras
+chatbot
+Delmonte
+genetic-algorithm
+Prove that the entanglement definition of AME implies the error correction definition of AME
+unity-game-engine
+Facebook
+Legal advice from an AI is illegal
+Life & arts
+How to use chatgpt for reviewing and analizing my Oracle database [closed]
+rag
+heuristics
+python
+nlp
+Visit the blog
+image-processing
+python-3.x
+llamacpp
+conv-neural-network
+OverflowAI
+Is SQL Injection possible if we're using only the IN keyword (no equals = operator) and we handle the single quote
+LinkedIn
+dataset
+Khawar Ali
+Business
+c++
+java
+Professional
+self-supervised-learning
+machine-learning
+Instagram
+algorithm
+API
+
+************
+
+llm model: deepseek-ai/DeepSeek-V2.5
+hallucination times: 5
+total analysis time: 34.291126012802124
+
+author and publish time(not formated): {'source': 'Stack Exchange Inc', 'publish_date': '2024.12.17'}
+infos(not formated):
+
+more urls:
+computer-vision
+chat-gpt-4
+face-recognition
+langchain
+tensorflow
+c#
+artificial-intelligence
+a-star
+No module named 'ppaquette_gym_doom'
+large-language-model
+InsightFace not using GPU [closed]
+Contrastive Loss from Scratch
+Where can I find datasets for medical document analysis and disease diagnosis using NLP? [closed]
+cuda
+AI agents that help doctors get paid
+minimax
+Error: "Vectors must have the same length as the number of dimensions" when adding documents to FAISS vector store in LangChain [closed]
+search
+chatgpt-api
+Newest artificial-intelligence questions feed
+keras
+chatbot
+Delmonte
+genetic-algorithm
+onnxruntime
+unity-game-engine
+Legal advice from an AI is illegal
+deep-learning
+How to use chatgpt for reviewing and analizing my Oracle database [closed]
+rag
+heuristics
+python
+Classify images based on line thickness,, text size, and background color [closed]
+nlp
+image-processing
+python-3.x
+llamacpp
+Which representation of the Softmax function is correct? [closed]
+OverflowAI
+conv-neural-network
+dataset
+Khawar Ali
+How to Improve CNN Model Performance for Image Classification in PyTorch? [closed]
+c++
+java
+self-supervised-learning
+machine-learning
+algorithm
+
+************
+
+llm model: Qwen/QwQ-32B-Preview
+hallucination times: 0
+total analysis time: 1120.614347934723
+
+author and publish time(not formated): {'source': 'NA', 'publish_date': 'NA'}
+infos(not formated):
+大模型技术突破与创新: 包括新算法与模型,新的研究成果
+AI应用市场规模与增长预测: 提供AI市场的最新统计数据、增长趋势和未来预测,帮助读者了解行业发展方向的信息
+大模型落地行业应用趋势: 分析大模型在各个行业(如医疗、金融、制造、教育)的应用现状和发展前景,展示AI在实际业务中的价值
+大模型企业应用案例: 分享企业如何利用大模型提升效率、降低成本或创新产品的具体案例,展示AI的实际效益
+大模型创业故事: 介绍大模型初创公司的发展历程、融资情况和成功经验,激励创业者和投资者
+好用的AI工具及其适用的范围,和同类型工具的对比: 提供有关实用AI工具的信息,包括它们的适用范围以及与同类工具的比较
+大模型技术突破与创新: I am working on an image classification project using PyTorch and have implemented a Convolutional Neural Network (CNN) model. While the model is functional, I am looking for ways to improve its ...
+大模型技术突破与创新: I have a task where I need to implement an R_max algorithm with modified policy iteration over the frozen lake problem. I first tried to just implement a regular modified policy iteration and it ...
+大模型技术突破与创新: I'm training a model using Hugging Face's Trainer with DeepSpeed integration, and I'm encountering an error related to mismatched tensor sizes: The size of tensor a (50) must match the size of tensor ...
+大模型技术突破与创新: I am trying to implement/learn how to implement contrastive loss. Currently my gradients are exploding into infinity and I think I must have misimplemented something. I was wondering if someone could ...
+大模型技术突破与创新: I'm working on a healthcare-related project where I need to analyze medical documents, extract specific values (e.g., creatinine, glucose levels, etc.), and generate personalized paragraphs for ...
+大模型技术突破与创新: I'm trying to embed and store documents in a FAISS vector store using LangChain, but I'm encountering the error: Vectors must have the same length as the number of dimensions I'm using a locally ...
+大模型技术突破与创新: I came across the formula for the Softmax function: Softmax formula However, I've found two very different visual representations of the Softmax function, and I'm confused about which one is correct: ...
+大模型企业应用案例: I want to write a simple VS Code extension that calls OpenAI API and tells the user the day in Danish. I cannot find the extension when searching for it in the Extension Development Host window (after ...
+大模型技术突破与创新: In the field of generalized planning, for a classical planning problem, we can only use classical planners (such as Fast Downward) to derive an action sequence, which is essentially a plan. However, I ...
+大模型技术突破与创新: With ChatGPT we have the option: “How would you like ChatGPT to respond?” Where we can give indications on how we expect it to respond. Is the same feature available in GitHub Copilot(GC) or are there ...
+大模型技术突破与创新: intellij-idea artificial-intelligence github-copilot akuma84,641 asked Dec 11 at 0:32 153050 per page 12345…597 Next The Overflow Blog AI agents that help doctors get paid Legal advice from an AI is illegal Featured on Meta The December 2024 Community Asks Sprint has been moved to March 2025 (and... Stack Overflow Jobs is expanding to more countries Related Tags python × 2550 machine-learning × 2102 neural-network × 1153 algorithm × 886 tensorflow × 706 deep-learning × 589 java × 561 nlp × 414 c# × 356 keras × 341 more related tags Hot Network Questions Why no
+AI应用市场规模与增长预测: intellij-idea artificial-intelligence github-copilot akuma84,641 asked Dec 11 at 0:32 153050 per page 12345…597 Next The Overflow Blog AI agents that help doctors get paid Legal advice from an AI is illegal Featured on Meta The December 2024 Community Asks Sprint has been moved to March 2025 (and... Stack Overflow Jobs is expanding to more countries Related Tags python × 2550 machine-learning × 2102 neural-network × 1153 algorithm × 886 tensorflow × 706 deep-learning × 589 java × 561 nlp × 414 c# × 356 keras × 341 more related tags Hot Network Questions Why no
+大模型落地行业应用趋势: intellij-idea artificial-intelligence github-copilot akuma84,641 asked Dec 11 at 0:32 153050 per page 12345…597 Next The Overflow Blog AI agents that help doctors get paid Legal advice from an AI is illegal Featured on Meta The December 2024 Community Asks Sprint has been moved to March 2025 (and... Stack Overflow Jobs is expanding to more countries Related Tags python × 2550 machine-learning × 2102 neural-network × 1153 algorithm × 886 tensorflow × 706 deep-learning × 589 java × 561 nlp × 414 c# × 356 keras × 341 more related tags Hot Network Questions Why no
+大模型企业应用案例: intellij-idea artificial-intelligence github-copilot akuma84,641 asked Dec 11 at 0:32 153050 per page 12345…597 Next The Overflow Blog AI agents that help doctors get paid Legal advice from an AI is illegal Featured on Meta The December 2024 Community Asks Sprint has been moved to March 2025 (and... Stack Overflow Jobs is expanding to more countries Related Tags python × 2550 machine-learning × 2102 neural-network × 1153 algorithm × 886 tensorflow × 706 deep-learning × 589 java × 561 nlp × 414 c# × 356 keras × 341 more related tags Hot Network Questions Why no
+大模型创业故事: intellij-idea artificial-intelligence github-copilot akuma84,641 asked Dec 11 at 0:32 153050 per page 12345…597 Next The Overflow Blog AI agents that help doctors get paid Legal advice from an AI is illegal Featured on Meta The December 2024 Community Asks Sprint has been moved to March 2025 (and... Stack Overflow Jobs is expanding to more countries Related Tags python × 2550 machine-learning × 2102 neural-network × 1153 algorithm × 886 tensorflow × 706 deep-learning × 589 java × 561 nlp × 414 c# × 356 keras × 341 more related tags Hot Network Questions Why no
+好用的AI工具及其适用的范围,和同类型工具的对比: intellij-idea artificial-intelligence github-copilot akuma84,641 asked Dec 11 at 0:32 153050 per page 12345…597 Next The Overflow Blog AI agents that help doctors get paid Legal advice from an AI is illegal Featured on Meta The December 2024 Community Asks Sprint has been moved to March 2025 (and... Stack Overflow Jobs is expanding to more countries Related Tags python × 2550 machine-learning × 2102 neural-network × 1153 algorithm × 886 tensorflow × 706 deep-learning × 589 java × 561 nlp × 414 c# × 356 keras × 341 more related tags Hot Network Questions Why no
+大模型技术突破与创新: 包括新算法与模型,新的研究成果
+AI应用市场规模与增长预测: 提供AI市场的最新统计数据、增长趋势和未来预测,帮助读者了解行业发展方向的信息
+大模型落地行业应用趋势: 分析大模型在各个行业(如医疗、金融、制造、教育)的应用现状和发展前景,展示AI在实际业务中的价值
+大模型企业应用案例: 分享企业如何利用大模型提升效率、降低成本或创新产品的具体案例,展示AI的实际效益
+大模型创业故事: 介绍大模型初创公司的发展历程、融资情况和成功经验,激励创业者和投资者
+好用的AI工具及其适用的范围,和同类型工具的对比: 提供实用的AI工具推荐,说明其适用范围,并与同类工具进行比较
+more urls:
+planning
+About the company
+Legal advice from an AI is illegal
+policy
+neural-network
+Where can I find datasets for medical document analysis and disease diagnosis using NLP? [closed]
+AI agents that help doctors get paid
+heuristics
+search
+activation-function
+keras
+self-supervised-learning
+tensorflow
+Visit the blog
+pddl
+a-star
+company blog
+conv-neural-network
+
+************
+
+llm model: Qwen/Qwen2.5-Coder-32B-Instruct
+hallucination times: 5
+total analysis time: 4.941272258758545
+
+author and publish time(not formated): {'source': 'NA', 'publish_date': 'NA'}
+infos(not formated):
+
+more urls:
+keras
+chatbot
+tensorflow
+AI agents that help doctors get paid
+conv-neural-network
+
+************
+
+llm model: Qwen/Qwen2.5-32B-Instruct
+hallucination times: 5
+total analysis time: 5.811862945556641
+
+author and publish time(not formated): {'source': 'NA', 'publish_date': 'NA'}
+infos(not formated):
+
+more urls:
+AI agents that help doctors get paid
+R_max algorithm doesn't converge to the right policy
+Contrastive Loss from Scratch
+Where can I find datasets for medical document analysis and disease diagnosis using NLP? [closed]
+
+************
+
+llm model: Qwen/Qwen2.5-14B-Instruct
+hallucination times: 5
+total analysis time: 7.778684854507446
+
+author and publish time(not formated): {'source': 'NA', 'publish_date': 'NA'}
+infos(not formated):
+
+more urls:
+
+
+************
+
+llm model: Qwen/Qwen2.5-Coder-7B-Instruct
+hallucination times: 5
+total analysis time: 4.300045013427734
+
+author and publish time(not formated): {'source': 'NA', 'publish_date': 'NA'}
+infos(not formated):
+
+more urls:
+unity-game-engine
+algorithm
+Contrastive Loss from Scratch
+Prove that the entanglement definition of AME implies the error correction definition of AME
+AI agents that help doctors get paid
+How to use chatgpt for reviewing and analizing my Oracle database [closed]
+heuristics
+have someone to do something
+Newest artificial-intelligence questions feed
+chatbot
+tensorflow
+Why are languages commonly structured as trees?
+genetic-algorithm
+a-star
+python-3.x
+conv-neural-network
+Expressing an assumption that all variables are mutually distinct and come from a specified set
+
+************
+
+llm model: 01-ai/Yi-1.5-34B-Chat-16K
+hallucination times: 10
+total analysis time: 26.213049173355103
+
+author and publish time(not formated): {'source': 'Stack Overflow', 'publish_date': 'NA'}
+infos(not formated):
+大模型技术突破与创新: I frequently use ChatGPT for various tasks such as writing documents, developing SQL queries, programming functions, and more. However, I would like to utilize ChatGPT specifically to analyze some ...
+大模型技术突破与创新: Convolutional Neural Network (CNN) model implementation
+AI应用市场规模与增长预测: The size of tensor a (50) must match the size of tensor b (100)
+大模型落地行业应用趋势: I'm encountering an error related to mismatched tensor sizes
+大模型企业应用案例: I'm training a model using Hugging Face's Trainer with DeepSpeed integration
+大模型创业故事: I was wondering if someone could help me
+好用的AI工具及其适用的范围,和同类型工具对比: I need to analyze medical documents, extract specific values (e.g., creatinine, glucose levels, etc.), and generate personalized paragraphs
+大模型技术突破与创新: I'm trying to embed and store documents in a FAISS vector store using LangChain, but I'm encountering the error: Vectors must have the same length as the number of dimensions I'm using a locally ...
+AI应用市场规模与增长预测: I'm trying to find a way to classify images based on their aptitude to be printed on clothing, ideally using a python library. The main thing I'm trying to do is find text size and color and general ...
+大模型落地行业应用趋势: However, I've found two very different visual representations of the Softmax function, and I'm confused about which one is correct: ...
+大模型企业应用案例: I want to write a simple VS Code extension that calls OpenAI API and tells the user the day in Danish. I cannot find the extension when searching for it in the Extension Development Host window (after ...
+大模型创业故事: However, I've found two very different visual representations of the Softmax function, and I'm confused about which one is correct: ...
+好用的AI工具及其适用的范围,和同类型工具对比: With ChatGPT we have the option: “How would you like ChatGPT to respond?” Where we can give indications on how we expect it to respond. Is the same feature available in GitHub Copilot(GC) or are there ...
+大模型技术突破与创新: intellij-ideaartificial-intelligencegithub-copilotakuma84,641asked Dec 11 at 0:32153050per page12345…597NextThe Overflow BlogAI agents that help doctors get paidLegal advice from an AI is illegalFeatured on MetaThe December 2024 Community Asks Sprint has been moved to March 2025 (and...Stack Overflow Jobs is expanding to more countriesRelated Tags
+AI应用市场规模与增长预测: STACK EXCHANGE NETWORK
+大模型落地行业应用趋势: TechnologyCulture & recreationLife & artsScienceProfessionalBusinessAPI
+大模型企业应用案例: DataBlog
+大模型创业故事: FacebookTwitterLinkedInInstagram
+好用的AI工具及其适用的范围,和同类型工具对比: Site design / logo © 2024 Stack Exchange Inc; user contributions licensed under CC BY-SA . rev 2024.12.17.20550
+more urls:
+AI agents that help doctors get paid
+How to determine what is opening tmp files when I invoke a subshell with ksh
+a-star
+Does the double origin plane have a cut point?
+Newest artificial-intelligence questions feed
+keras
+tensorflow
+What is the meaning of the second line of the piecewise output of SeriesCoefficient[]?
+genetic-algorithm
+algorithm
+Is SQL Injection possible if we're using only the IN keyword (no equals = operator) and we handle the single quote
+conv-neural-network
+
+************
+
+raw materials: e8c97c
+
+llm model: Qwen/Qwen2.5-7B-Instruct
+hallucination times: 1
+total analysis time: 3.069563150405884
+
+author and publish time(not formated): {'source': 'NA', 'publish_date': '2024-01-17'}
+infos(not formated):
+大模型技术突破与创新: 赌上一切的李彦宏可能真要赢?大模型企业到了见真章的时候,赌上一切的李彦宏可能真要赢?
+AI应用市场规模与增长预测: 半月暴涨3万亿,资金正疯狂涌入又一个黑科技即将爆发?
+more urls:
+谷歌发了个新模型,顺手证明Sora才是最菜的
+
+************
+
+llm model: THUDM/glm-4-9b-chat
+hallucination times: 1
+total analysis time: 11.059188842773438
+
+author and publish time(not formated): {'source': 'NA', 'publish_date': 'NA'}
+infos(not formated):
+#大模型技术突破与创新: 科技谷歌发了个新模型,顺手证明Sora才是最菜的看来,在这场AI战争中,还有的是逆转的好戏。
+#大模型技术突破与创新: 赌上一切的李彦宏可能真要赢?大模型企业到了见真章的时候,赌上一切的李彦宏可能真要赢?
+#AI应用市场规模与增长预测: 半年狂赚46亿,富二代创业拿捏中产,“最和睦富豪家族”正有序接班?这个地方真的“盛产霸总”。
+#大模型落地行业应用趋势: 74亿,阿里巴巴出售银泰百货银泰百货缩水近百亿。
+#大模型企业应用案例: 24万“AI民工”血汗,哺出一个95后亿万富豪华人AI数据标注独角兽陷用工争议。
+#大模型创业故事: 半年狂赚46亿,富二代创业拿捏中产,“最和睦富豪家族”正有序接班?这个地方真的“盛产霸总”。
+#好用的AI工具及其适用的范围,和同类型工具的对比: ChatGPT搜索,全球免费,Her动嘴实时搜,暴打谷歌边聊边搜ChatGPT搜索功能,全球免费用户可用了!更令人惊喜的是,搜索将集成到Her中,可以让我们实时通话进行搜索。
+#好用的AI工具及其适用的范围,和同类型工具的对比: AI+玩偶:是儿童市场的新风口,还是智能硬件的老泡沫?门槛不高、玩家众多,尚有广阔空白市场。
+more urls:
+24万“AI民工”血汗,哺出一个95后亿万富豪
+谷歌发了个新模型,顺手证明Sora才是最菜的
+「先享后付」暗藏陷阱,线下消费该如何避坑?
+智能车参考
+学校新来的AI体育老师,量身定制每天1小时最合理运动计划
+谁为AI事故负责?
+赌上一切的李彦宏可能真要赢?
+谈谈人工智能时代的数据战略
+AI+玩偶:是儿童市场的新风口,还是智能硬件的老泡沫?
+氪星晚报 | 贵州茅台:回购股份前期工作即将完成;蚂蚁集团1亿在上海成立科技公司,含多项AI业务;蜜雪冰城回应多个城市门店涨价:运营成本变化
+人工智能·AI
+出海速递|特朗普会见TikTok CEO周受资/中国短剧出海刺激日本龙头入局
+大疆自动驾驶,获中国销量TOP 2车企同时入股
+特斯拉新车遭遇重大自动驾驶系统问题,极氪7X登陆欧洲市场|海外日报
+
+************
+
+llm model: deepseek-ai/DeepSeek-V2.5
+hallucination times: 1
+total analysis time: 35.50351810455322
+
+author and publish time(not formated): {'source': 'NA', 'publish_date': '2024-12-17'}
+infos(not formated):
+#大模型技术突破与创新: 谷歌发了个新模型,顺手证明Sora才是最菜的看来,在这场AI战争中,还有的是逆转的好戏。
+#大模型技术突破与创新: ChatGPT搜索功能,全球免费用户可用了!更令人惊喜的是,搜索将集成到Her中,可以让我们实时通话进行搜索。
+#大模型企业应用案例: 赌上一切的李彦宏可能真要赢?大模型企业到了见真章的时候,赌上一切的李彦宏可能真要赢?
+#大模型技术突破与创新: 学校新来的AI体育老师,量身定制每天1小时最合理运动计划宇视科技AI文教体:为孩子、为明天、为未来。
+#大模型技术突破与创新: AI+玩偶:是儿童市场的新风口,还是智能硬件的老泡沫?门槛不高、玩家众多,尚有广阔空白市场。
+#大模型技术突破与创新: 半月暴涨3万亿,资金正疯狂涌入又一个黑科技即将爆发?
+#大模型技术突破与创新: 谁为AI事故负责?AI时代,侵权责任制度往何处去?
+more urls:
+24万“AI民工”血汗,哺出一个95后亿万富豪
+谷歌发了个新模型,顺手证明Sora才是最菜的
+半年狂赚46亿,富二代创业拿捏中产,“最和睦富豪家族”正有序接班?
+学校新来的AI体育老师,量身定制每天1小时最合理运动计划
+谁为AI事故负责?
+赌上一切的李彦宏可能真要赢?
+谈谈人工智能时代的数据战略
+探秘虚拟消费:2024游戏及网络服务行业营销趋势洞察
+HiEV
+凤凰网科技
+AI+玩偶:是儿童市场的新风口,还是智能硬件的老泡沫?
+腾讯研究院
+ChatGPT搜索,全球免费,Her动嘴实时搜,暴打谷歌边聊边搜
+
+************
+
+llm model: Qwen/QwQ-32B-Preview
+hallucination times: 0
+total analysis time: 207.32083296775818
+
+author and publish time(not formated): {'source': '36氪', 'publish_date': '2024-01-17'}
+infos(not formated):
+大模型技术突破与创新: 谷歌发了个新模型,顺手证明Sora才是最菜的。看来,在这场AI战争中,还有的是逆转的好戏。
+大模型技术突破与创新: 大疆自动驾驶,获中国销量TOP 2车企同时入股“量产10万级智能车”。
+大模型技术突破与创新: ChatGPT搜索,全球免费,Her动嘴实时搜,暴打谷歌边聊边搜ChatGPT搜索功能,全球免费用户可用了!更令人惊喜的是,搜索将集成到Her中,可以让我们实时通话进行搜索。
+大模型技术突破与创新: 谈谈人工智能时代的数据战略。
+大模型技术突破与创新: 赌上一切的李彦宏可能真要赢?大模型企业到了见真章的时候,赌上一切的李彦宏可能真要赢?
+大模型技术突破与创新: AI+玩偶:是儿童市场的新风口,还是智能硬件的老泡沫?门槛不高、玩家众多,尚有广阔空白市场。
+大模型技术突破与创新: 半月暴涨3万亿,资金正疯狂涌入又一个黑科技即将爆发?
+大模型落地行业应用趋势: 美团医美:屠龙少年还是恶龙?
+大模型落地行业应用趋势: 极越CEO夏一平发长文道歉,随后又悄悄删掉……百度、吉利为老车主兜底。
+大模型落地行业应用趋势: 迈凯伦又被卖了,这次出手的是蔚来第一大股东。
+大模型落地行业应用趋势: 增程2.0时代:小米、小鹏入场,谁能领跑增程下半场?头部车企集体拥抱增程。
+大模型落地行业应用趋势: 学校新来的AI体育老师,量身定制每天1小时最合理运动计划。
+大模型企业应用案例: 美团医美:屠龙少年还是恶龙?
+大模型企业应用案例: 极越CEO夏一平发长文道歉,随后又悄悄删掉……百度、吉利为老车主兜底。
+大模型企业应用案例: 迈凯伦又被卖了,这次出手的是蔚来第一大股东。
+大模型企业应用案例: 增程2.0时代:小米、小鹏入场,谁能领跑增程下半场?头部车企集体拥抱增程。
+大模型企业应用案例: 学校新来的AI体育老师,量身定制每天1小时最合理运动计划。
+大模型创业故事: 24万“AI民工”血汗,哺出一个95后亿万富豪华人AI数据标注独角兽陷用工争议。
+大模型创业故事: 74亿,阿里巴巴出售银泰百货银泰百货缩水近百亿。
+大模型创业故事: 半年狂赚46亿,富二代创业拿捏中产,“最和睦富豪家族”正有序接班?这个地方真的“盛产霸总”。
+大模型创业故事: 茶饮界的「小镇王者」,再战港交所茶饮新贵上市潮要来了?
+大模型技术突破与创新: 特斯拉新车遭遇重大自动驾驶系统问题,极氪7X登陆欧洲市场
+AI应用市场规模与增长预测: 12月17日EV Focus海外日报
+大模型落地行业应用趋势: 科技狂砸8000亿的“烧钱巨兽”,在全球整容成功烧钱巨兽,彻底赚回脸面
+大模型企业应用案例: 这一轮地铁建设,谁是赢家郑州苏州,增量明显
+more urls:
+AI+玩偶:是儿童市场的新风口,还是智能硬件的老泡沫?
+学校新来的AI体育老师,量身定制每天1小时最合理运动计划
+
+************
+
+llm model: Qwen/Qwen2.5-Coder-32B-Instruct
+hallucination times: 1
+total analysis time: 6.860621213912964
+
+author and publish time(not formated): {'source': 'NA', 'publish_date': 'NA'}
+infos(not formated):
+大模型技术突破与创新: 谷歌发了个新模型,顺手证明Sora才是最菜的看来,在这场AI战争中,还有的是逆转的好戏。
+大模型技术突破与创新: ChatGPT搜索,全球免费,Her动嘴实时搜,暴打谷歌边聊边搜ChatGPT搜索功能,全球免费用户可用了!更令人惊喜的是,搜索将集成到Her中,可以让我们实时通话进行搜索。
+大模型企业应用案例: 赌上一切的李彦宏可能真要赢?大模型企业到了见真章的时候,赌上一切的李彦宏可能真要赢?
+大模型企业应用案例: 学校新来的AI体育老师,量身定制每天1小时最合理运动计划宇视科技AI文教体:为孩子、为明天、为未来。
+大模型企业应用案例: AI+玩偶:是儿童市场的新风口,还是智能硬件的老泡沫?门槛不高、玩家众多,尚有广阔空白市场。
+more urls:
+AI+玩偶:是儿童市场的新风口,还是智能硬件的老泡沫?
+学校新来的AI体育老师,量身定制每天1小时最合理运动计划
+谷歌发了个新模型,顺手证明Sora才是最菜的
+谈谈人工智能时代的数据战略
+
+************
+
+llm model: Qwen/Qwen2.5-32B-Instruct
+hallucination times: 1
+total analysis time: 9.577956914901733
+
+author and publish time(not formated): {'source': 'NA', 'publish_date': 'NA'}
+infos(not formated):
+大模型技术突破与创新: 谷歌发了个新模型,顺手证明Sora才是最菜的看来,在这场AI战争中,还有的是逆转的好戏。
+大模型技术突破与创新: ChatGPT搜索,全球免费,Her动嘴实时搜,暴打谷歌边聊边搜ChatGPT搜索功能,全球免费用户可用了!更令人惊喜的是,搜索将集成到Her中,可以让我们实时通话进行搜索。
+大模型企业应用案例: 赌上一切的李彦宏可能真要赢?大模型企业到了见真章的时候,赌上一切的李彦宏可能真要赢?
+more urls:
+AI+玩偶:是儿童市场的新风口,还是智能硬件的老泡沫?
+谷歌发了个新模型,顺手证明Sora才是最菜的
+特斯拉新车遭遇重大自动驾驶系统问题,极氪7X登陆欧洲市场|海外日报
+学校新来的AI体育老师,量身定制每天1小时最合理运动计划
+谁为AI事故负责?
+谈谈人工智能时代的数据战略
+
+************
+
+llm model: Qwen/Qwen2.5-14B-Instruct
+hallucination times: 2
+total analysis time: 2.992058038711548
+
+author and publish time(not formated): {'source': 'NA', 'publish_date': 'NA'}
+infos(not formated):
+
+more urls:
+谷歌发了个新模型,顺手证明Sora才是最菜的
+
+************
+
+llm model: Qwen/Qwen2.5-Coder-7B-Instruct
+hallucination times: 2
+total analysis time: 2.6526970863342285
+
+author and publish time(not formated): {'source': 'NA', 'publish_date': 'NA'}
+infos(not formated):
+
+more urls:
+半年狂赚46亿,富二代创业拿捏中产,“最和睦富豪家族”正有序接班?
+谷歌发了个新模型,顺手证明Sora才是最菜的
+24万“AI民工”血汗,哺出一个95后亿万富豪
+大疆自动驾驶,获中国销量TOP 2车企同时入股
+迈凯伦又被卖了,这次出手的是蔚来第一大股东
+8万元买个“碗”,有年轻人,靠“修仙”暴富了?
+
+************
+
+llm model: 01-ai/Yi-1.5-34B-Chat-16K
+hallucination times: 0
+total analysis time: 9.193757772445679
+
+author and publish time(not formated): {'source': '王兴与美团|互联网江湖', 'publish_date': '2023-04-24'}
+infos(not formated):
+#AI应用市场规模与增长预测: 全球免费用户可用了!更令人惊喜的是,搜索将集成到Her中,可以让我们实时通话进行搜索。
+#大模型落地行业应用趋势: 头部车企集体拥抱增程。
+#大模型企业应用案例: 百度、吉利为老车主兜底。
+#大模型创业故事: 华人AI数据标注独角兽陷用工争议。
+#好用的AI工具及其适用的范围,和同类型工具对比: 边聊边搜ChatGPT搜索功能,全球免费用户可用了!
+大模型技术突破与创新: 特斯拉新车遭遇重大自动驾驶系统问题
+AI应用市场规模与增长预测: 极氪7X登陆欧洲市场
+大模型落地行业应用趋势: 海外日报
+大模型企业应用案例: 科技狂砸8000亿的“烧钱巨兽”,在全球整容成功
+好用的AI工具及其适用的范围,和同类型工具对比: 查看更多推荐
+more urls:
+谷歌发了个新模型,顺手证明Sora才是最菜的
+特斯拉新车遭遇重大自动驾驶系统问题,极氪7X登陆欧洲市场|海外日报
+谁为AI事故负责?
+谈谈人工智能时代的数据战略
+探秘虚拟消费:2024游戏及网络服务行业营销趋势洞察
+
+************
+
+raw materials: 29229b
+
+llm model: Qwen/Qwen2.5-7B-Instruct
+hallucination times: 1
+total analysis time: 1.2605299949645996
+
+author and publish time(not formated): {'source': 'NA', 'publish_date': 'NA'}
+infos(not formated):
+
+more urls:
+
+
+************
+
+llm model: THUDM/glm-4-9b-chat
+hallucination times: 0
+total analysis time: 8.097972869873047
+
+author and publish time(not formated): {'source': 'u/MetaKnowing', 'publish_date': 'NA'}
+infos(not formated):
+大模型技术突破与创新: Llama 3.3 better than 4o, o1I have started myself to shift from ChatGPT models because now they have started to go out of context for no reason. You ask them to make a summary of what we have discussed on this chat so far and it fails to note the important points. And if the chat is pretty lengthy, it just dismisses and gets bizarre info out of it. I think I smell the commercialness of it spreading across the room. I have had better output from the recent Microsoft's phi-4 model compared to 4o.u/HoodyPrivacy
+大模型技术突破与创新: Hoody AI: anonymous access to the best AI model providers from a privacy-first unified dashboard.hoody.comView More
+more urls:
+Comedy Movies & Series
+Adobe AI
+Hugging Face
+Character.AI
+Stability AI
+More Communities
+Adventure Games
+About Reddit
+Google AI
+Esports
+OpenAI
+Suno AI
+Time 100 AI List 2024
+Subreddit Update
+r/OpenAI
+Gaming Consoles & Gear
+Action Movies & Series
+Figure AI
+ElevenLabs
+Funny
+Reddit, Inc. © 2024. All rights reserved.
+Crime, Mystery, & Thriller Movies & Series
+Amazon AWS
+Mobile Games
+Forbes AI 50 List 2024
+Mistral AI
+Midjourney
+Wholesome & Heartwarming
+Other Games
+Computers & Hardware
+Perplexity
+Cringe & Facepalm
+Animals & Pets
+Anthropic
+Animated Movies & Series
+AI space blog
+Oddly Satisfying
+Reddit Meta
+Gaming News & Discussion
+r/ChatGPT
+r/ClaudeAI
+Fortune 50 AI List 2024
+Virtual & Augmented Reality
+Wiki
+Meta AI
+Artificial Intelligence & Machine Learning
+Memes
+Apple ML
+IBM AI
+Software & Apps
+Runway
+Microsoft AI
+NVIDIA DL
+Action Games
+Interesting
+Amazing
+
+************
+
+llm model: deepseek-ai/DeepSeek-V2.5
+hallucination times: 1
+total analysis time: 268.38720703125
+
+author and publish time(not formated): {'source': 'NA', 'publish_date': 'NA'}
+infos(not formated):
+
+more urls:
+Anthropic
+Adobe AI
+Hugging Face
+Character.AI
+Stability AI
+Fortune 50 AI List 2024
+Google AI
+OpenAI
+Suno AI
+Time 100 AI List 2024
+Meta AI
+Artificial Intelligence & Machine Learning
+Figure AI
+ElevenLabs
+Apple ML
+IBM AI
+Amazon AWS
+Runway
+Mistral AI
+Midjourney
+Microsoft AI
+Perplexity
+NVIDIA DL
+
+************
+
+llm model: Qwen/QwQ-32B-Preview
+hallucination times: 0
+total analysis time: 156.68537187576294
+
+author and publish time(not formated): {'source': 'NA', 'publish_date': 'NA'}
+infos(not formated):
+大模型技术突破与创新: Llama 3.3 better than 4o, o1I have started myself to shift from ChatGPT models because now they have started to go out of context for no reason. You ask them to make a summary of what we have discussed on this chat so far and it fails to note the important points. And if the chat is pretty lengthy, it just dismisses and gets bizarre info out of it. I think I smell the commercialness of it spreading across the room. I have had better output from the recent Microsoft's phi-4 model compared to 4o.
+大模型落地行业应用趋势: I have started myself to shift from ChatGPT models because now they have started to go out of context for no reason. You ask them to make a summary of what we have discussed on this chat so far and it fails to note the important points. And if the chat is pretty lengthy, it just dismisses and gets bizarre info out of it.
+大模型企业应用案例: I have had better output from the recent Microsoft's phi-4 model compared to 4o.
+more urls:
+
+
+************
+
+llm model: Qwen/Qwen2.5-Coder-32B-Instruct
+hallucination times: 1
+total analysis time: 2.6813371181488037
+
+author and publish time(not formated): {'source': 'NA', 'publish_date': 'NA'}
+infos(not formated):
+
+more urls:
+Hugging Face
+Apple ML
+IBM AI
+Amazon AWS
+Software & Apps
+Tech News & Discussion
+Microsoft AI
+Computers & Hardware
+Programming
+Fortune 50 AI List 2024
+Google AI
+NVIDIA DL
+OpenAI
+Time 100 AI List 2024
+Meta AI
+Artificial Intelligence & Machine Learning
+
+************
+
+llm model: Qwen/Qwen2.5-32B-Instruct
+hallucination times: 1
+total analysis time: 1.6181750297546387
+
+author and publish time(not formated): {'source': 'NA', 'publish_date': 'NA'}
+infos(not formated):
+
+more urls:
+Artificial Intelligence & Machine Learning
+
+************
+
+llm model: Qwen/Qwen2.5-14B-Instruct
+hallucination times: 1
+total analysis time: 6.041625022888184
+
+author and publish time(not formated): {'source': 'NA', 'publish_date': 'NA'}
+infos(not formated):
+
+more urls:
+Anthropic
+Adobe AI
+Hugging Face
+Character.AI
+Stability AI
+Google AI
+OpenAI
+Suno AI
+Meta AI
+Figure AI
+ElevenLabs
+Apple ML
+IBM AI
+Amazon AWS
+Forbes AI 50 List 2024
+Runway
+Mistral AI
+Midjourney
+Microsoft AI
+Perplexity
+NVIDIA DL
+
+************
+
+llm model: Qwen/Qwen2.5-Coder-7B-Instruct
+hallucination times: 1
+total analysis time: 2.6163320541381836
+
+author and publish time(not formated): {'source': 'NA', 'publish_date': 'NA'}
+infos(not formated):
+
+more urls:
+Anthropic
+Adobe AI
+Hugging Face
+AI space blog
+Character.AI
+Stability AI
+r/ChatGPT
+r/ClaudeAI
+Fortune 50 AI List 2024
+Google AI
+OpenAI
+Suno AI
+Time 100 AI List 2024
+Subreddit Update
+Wiki
+r/OpenAI
+Meta AI
+Artificial Intelligence & Machine Learning
+Figure AI
+ElevenLabs
+Apple ML
+IBM AI
+Amazon AWS
+Forbes AI 50 List 2024
+Runway
+Mistral AI
+Midjourney
+Microsoft AI
+Tech News & Discussion
+Perplexity
+NVIDIA DL
+
+************
+
+llm model: 01-ai/Yi-1.5-34B-Chat-16K
+hallucination times: 0
+total analysis time: 6.707098007202148
+
+author and publish time(not formated): {'source': 'u/socialmeai', 'publish_date': 'NA'}
+infos(not formated):
+大模型技术突破与创新: Llama 3.3 better than 4o
+大模型落地行业应用趋势: Hoody AI: anonymous access to the best AI model providers from a privacy-first unified dashboard
+大模型创业故事: Microsoft's phi-4 model
+好用的AI工具及其适用的范围,和同类型工具对比: Llama 3.3 better than 4o
+more urls:
+Anthropic
+Adobe AI
+Hugging Face
+AI space blog
+Character.AI
+Stability AI
+Google AI
+OpenAI
+Suno AI
+TV News & Discussion
+Meta AI
+Artificial Intelligence & Machine Learning
+Figure AI
+ElevenLabs
+Apple ML
+IBM AI
+Amazon AWS
+Software & Apps
+Runway
+Mistral AI
+Midjourney
+Microsoft AI
+Tech News & Discussion
+Movie News & Discussion
+Perplexity
+NVIDIA DL
+
+************
+
+raw materials: ae77d4
+
+llm model: Qwen/Qwen2.5-7B-Instruct
+hallucination times: 4
+total analysis time: 7.368144989013672
+
+author and publish time(not formated): {}
+infos(not formated):
+
+more urls:
+Google Gemini 2.0: Could this be the beginning of truly autonomous AI?
+Scaling AI: Platform best practices
+OpenAI’s o1 model doesn’t show its thinking, giving open source an advantage
+Cohere’s smallest, fastest R-series model excels at RAG, reasoning in 23 languages
+Sapient debuts with new AI architectures, aiming to beat Transformers’ reasoning with recurrent neural networks
+Google debuts new AI video generator Veo 2 claiming better audience scores than Sora
+Gemini 2.0 Flash ushers in a new era of real-time multimodal AI
+Google’s new Trillium AI chip delivers 4x speed and powers Gemini 2.0
+Microsoft’s smaller AI model beats the big guys: Meet Phi-4, the efficiency king
+New LLM optimization technique slashes memory costs up to 75%
+ServiceNow open sources Fast-LLM in a bid to help enterprises train AI models 20% quicker
+OpenAI updates ChatGPT Search with voice queries, faster results, mobile maps integration
+Nvidia unveils next-gen AI and industrial digitalization capabilities at Microsoft Ignite
+See how Google Gemini 2.0 Flash can perform hours of business analysis in minutes
+OpenAI rolls out ChatGPT for iPhone in landmark AI integration with Apple
+
+************
+
+llm model: THUDM/glm-4-9b-chat
+hallucination times: 0
+total analysis time: 24.262537956237793
+
+author and publish time(not formated): {'source': 'NA', 'publish_date': 'NA'}
+infos(not formated):
+#AI应用市场规模与增长预测: No specific market size and growth predictions found
+#大模型落地行业应用趋势: No specific industry application trends found
+#大模型企业应用案例: No specific case studies found
+#大模型创业故事: No specific startup stories found
+#好用的AI工具及其适用的范围,和同类型工具的对比: No specific AI tools comparison found
+more urls:
+Data Management
+Cloud and Data Storage Security
+2017
+Data Security and Privacy
+Synthetic Data
+Text-to-Speech
+Computer Hardware Security
+Industrial Automation
+New LLM optimization technique slashes memory costs up to 75%
+Test Management
+Microsoft’s smaller AI model beats the big guys: Meet Phi-4, the efficiency king
+Google’s new Trillium AI chip delivers 4x speed and powers Gemini 2.0
+We’ve come a long way from RPA: How AI agents are revolutionizing automation
+Solos launches AirGo Vision — ChatGPT-enabled AI smart glasses with a camera
+Artificial Intelligence
+OpenAI updates ChatGPT Search with voice queries, faster results, mobile maps integration
+AI, ML and Deep Learning
+Big Data and Analytics
+Realtime AI video analysis app Lloyd will offer developer kit after passing 50,000 users
+2014
+OpenAI rolls out ChatGPT for iPhone in landmark AI integration with Apple
+OpenAI launches ChatGPT Projects, letting you organize files, chats in groups
+Business Process Automation
+Synthetic data has its limits — why human-sourced data can help prevent AI model collapse
+Follow us on Facebook
+How RapidCanvas automates 70% of data tasks for gen AI projects
+ServiceNow open sources Fast-LLM in a bid to help enterprises train AI models 20% quicker
+Follow us on RSS
+Automation
+See how Google Gemini 2.0 Flash can perform hours of business analysis in minutes
+Development Languages
+Data Networks
+Development Automation
+Network Security and Privacy
+NLP
+Data Labelling
+Google Gemini 2.0: Could this be the beginning of truly autonomous AI?
+Defending SOCs Under Siege: Battling Adversarial AI Attacks
+Press Releases
+OpenAI expands ChatGPT Canvas to all users
+2016
+VentureBeat
+Privacy Policy
+Contribute to DataDecisionMakers
+Contact Us
+Pin thinks AI can fix recruitment’s biggest problems — and it has the numbers to prove it
+Follow us on X
+Nvidia unveils next-gen AI and industrial digitalization capabilities at Microsoft Ignite
+Virtual Reality Collaboration
+Google unveils AI coding assistant ‘Jules,’ promising autonomous bug fixes and faster development cycles
+Software Security
+Virtual Employee Experience
+OpenAI’s o1 model doesn’t show its thinking, giving open source an advantage
+Cohere’s smallest, fastest R-series model excels at RAG, reasoning in 23 languages
+Sapient debuts with new AI architectures, aiming to beat Transformers’ reasoning with recurrent neural networks
+Data Storage and Cloud
+Google debuts new AI video generator Veo 2 claiming better audience scores than Sora
+Gemini 2.0 Flash ushers in a new era of real-time multimodal AI
+Anthropic’s fastest model, Claude 3.5 Haiku, now generally available
+Follow us on LinkedIn
+Conversational AI
+Lam Research launches collaborative robots to optimize critical maintenance in chip factories
+Product Development
+Programming & Development
+Auto ML
+Shutterstock pioneers ‘research license’ model with Lightricks, lowering barriers to AI training data
+Data Science
+Terms of Service
+Data Infrastructure
+2015
+Application Development
+Advertise
+
+************
+
+llm model: deepseek-ai/DeepSeek-V2.5
+hallucination times: 1
+total analysis time: 113.66382002830505
+
+author and publish time(not formated): {'source': 'Dean Takahashi', 'publish_date': '2024-12-16'}
+infos(not formated):
+大模型技术突破与创新: sapient debuts with new AI architectures, aiming to beat Transformers’ reasoning with recurrent neural networks
+more urls:
+Data Management
+Cloud and Data Storage Security
+Data Security and Privacy
+Synthetic Data
+Text-to-Speech
+Computer Hardware Security
+Industrial Automation
+New LLM optimization technique slashes memory costs up to 75%
+Microsoft’s smaller AI model beats the big guys: Meet Phi-4, the efficiency king
+Google’s new Trillium AI chip delivers 4x speed and powers Gemini 2.0
+Solos launches AirGo Vision — ChatGPT-enabled AI smart glasses with a camera
+Artificial Intelligence
+OpenAI updates ChatGPT Search with voice queries, faster results, mobile maps integration
+AI, ML and Deep Learning
+Big Data and Analytics
+Slack’s AI agents promise to reshape productivity with contextual power
+Business Process Automation
+ServiceNow open sources Fast-LLM in a bid to help enterprises train AI models 20% quicker
+Automation
+Security
+Data Networks
+NLP
+Development Automation
+Network Security and Privacy
+Data Labelling
+Google Gemini 2.0: Could this be the beginning of truly autonomous AI?
+MidJourney adds Pinterest-like ‘moodboards’ and support for multiple custom AI image models
+Lambda launches ‘inference-as-a-service’ API claiming lowest costs in AI industry
+Nvidia unveils next-gen AI and industrial digitalization capabilities at Microsoft Ignite
+Google unveils AI coding assistant ‘Jules,’ promising autonomous bug fixes and faster development cycles
+Software Security
+OpenAI’s o1 model doesn’t show its thinking, giving open source an advantage
+Taryn Plumb
+Cohere’s smallest, fastest R-series model excels at RAG, reasoning in 23 languages
+Sapient debuts with new AI architectures, aiming to beat Transformers’ reasoning with recurrent neural networks
+Data Storage and Cloud
+Gemini 2.0 Flash ushers in a new era of real-time multimodal AI
+Anthropic’s fastest model, Claude 3.5 Haiku, now generally available
+Conversational AI
+Auto ML
+Data Science
+Data Infrastructure
+
+************
+
+llm model: Qwen/QwQ-32B-Preview
+hallucination times: 0
+total analysis time: 1346.5701479911804
+
+author and publish time(not formated): {'source': 'Dean Takahashi', 'publish_date': '2024-12-16'}
+infos(not formated):
+#AI应用市场规模与增长预测: Artificial IntelligenceSecurityData InfrastructureAutomationEnterprise AnalyticsMore
+#大模型落地行业应用趋势: Dean Takahashi December 16, 2024 9:00 PM
+more urls:
+IP Copilot wants to use AI to turn your Slack messages into patents
+Pika 2.0 launches in wake of Sora, integrating your own characters, objects, scenes in new AI videos
+Google’s new Trillium AI chip delivers 4x speed and powers Gemini 2.0
+Microsoft’s smaller AI model beats the big guys: Meet Phi-4, the efficiency king
+Solos launches AirGo Vision — ChatGPT-enabled AI smart glasses with a camera
+Test Management
+Team Collaboration
+We’ve come a long way from RPA: How AI agents are revolutionizing automation
+‘Not there yet’: Sora rollout receives mixed response from AI filmmakers citing inconsistent results, content restrictions
+Realtime AI video analysis app Lloyd will offer developer kit after passing 50,000 users
+OpenAI rolls out ChatGPT for iPhone in landmark AI integration with Apple
+OpenAI launches ChatGPT Projects, letting you organize files, chats in groups
+Synthetic data has its limits — why human-sourced data can help prevent AI model collapse
+ServiceNow open sources Fast-LLM in a bid to help enterprises train AI models 20% quicker
+See how Google Gemini 2.0 Flash can perform hours of business analysis in minutes
+Development Languages
+Test Automation
+Google Gemini 2.0: Could this be the beginning of truly autonomous AI?
+Defending SOCs Under Siege: Battling Adversarial AI Attacks
+Disaster Recovery Business Continuity
+Robotic Process Automation
+Lambda launches ‘inference-as-a-service’ API claiming lowest costs in AI industry
+Pin thinks AI can fix recruitment’s biggest problems — and it has the numbers to prove it
+Virtual Communication
+Nvidia unveils next-gen AI and industrial digitalization capabilities at Microsoft Ignite
+Business Intelligence
+Virtual Reality Collaboration
+Google unveils AI coding assistant ‘Jules,’ promising autonomous bug fixes and faster development cycles
+Virtual Employee Experience
+Cohere’s smallest, fastest R-series model excels at RAG, reasoning in 23 languages
+Gemini 2.0 Flash ushers in a new era of real-time multimodal AI
+Anthropic’s fastest model, Claude 3.5 Haiku, now generally available
+Statistical Analysis
+Product Development
+Programming & Development
+Enterprise Analytics
+Predictive Analysis
+Shutterstock pioneers ‘research license’ model with Lightricks, lowering barriers to AI training data
+NotebookLM updates Business to Plus with more audio, lets all users interact with AI hosts
+Midjourney is launching a multiplayer collaborative worldbuilding tool called ‘Patchwork’
+UCaaS
+Lam Research launches collaborative robots to optimize critical maintenance in chip factories
+Application Development
+Data Decision Makers
+
+************
+
+llm model: Qwen/Qwen2.5-Coder-32B-Instruct
+hallucination times: 1
+total analysis time: 13.77305293083191
+
+author and publish time(not formated): {'source': 'Dean Takahashi', 'publish_date': '2024-12-16'}
+infos(not formated):
+
+more urls:
+IP Copilot wants to use AI to turn your Slack messages into patents
+Google Gemini 2.0: Could this be the beginning of truly autonomous AI?
+Google unveils AI coding assistant ‘Jules,’ promising autonomous bug fixes and faster development cycles
+Slack’s AI agents promise to reshape productivity with contextual power
+Cohere’s smallest, fastest R-series model excels at RAG, reasoning in 23 languages
+Sapient debuts with new AI architectures, aiming to beat Transformers’ reasoning with recurrent neural networks
+Google debuts new AI video generator Veo 2 claiming better audience scores than Sora
+Gemini 2.0 Flash ushers in a new era of real-time multimodal AI
+Anthropic’s fastest model, Claude 3.5 Haiku, now generally available
+New LLM optimization technique slashes memory costs up to 75%
+Microsoft’s smaller AI model beats the big guys: Meet Phi-4, the efficiency king
+Google’s new Trillium AI chip delivers 4x speed and powers Gemini 2.0
+ServiceNow open sources Fast-LLM in a bid to help enterprises train AI models 20% quicker
+OpenAI updates ChatGPT Search with voice queries, faster results, mobile maps integration
+AI, ML and Deep Learning
+Pin thinks AI can fix recruitment’s biggest problems — and it has the numbers to prove it
+Nvidia unveils next-gen AI and industrial digitalization capabilities at Microsoft Ignite
+
+************
+
+llm model: Qwen/Qwen2.5-32B-Instruct
+hallucination times: 0
+total analysis time: 25.689688682556152
+
+author and publish time(not formated): {'source': 'Dean Takahashi', 'publish_date': '2024-12-16'}
+infos(not formated):
+
+more urls:
+Google Gemini 2.0: Could this be the beginning of truly autonomous AI?
+MidJourney adds Pinterest-like ‘moodboards’ and support for multiple custom AI image models
+Google’s new Trillium AI chip delivers 4x speed and powers Gemini 2.0
+New LLM optimization technique slashes memory costs up to 75%
+Microsoft’s smaller AI model beats the big guys: Meet Phi-4, the efficiency king
+We’ve come a long way from RPA: How AI agents are revolutionizing automation
+OpenAI updates ChatGPT Search with voice queries, faster results, mobile maps integration
+Pin thinks AI can fix recruitment’s biggest problems — and it has the numbers to prove it
+Nvidia unveils next-gen AI and industrial digitalization capabilities at Microsoft Ignite
+The future of AI regulation is up in the air: What’s your next move?
+OpenAI launches ChatGPT Projects, letting you organize files, chats in groups
+OpenAI’s o1 model doesn’t show its thinking, giving open source an advantage
+Cohere’s smallest, fastest R-series model excels at RAG, reasoning in 23 languages
+Sapient debuts with new AI architectures, aiming to beat Transformers’ reasoning with recurrent neural networks
+Google debuts new AI video generator Veo 2 claiming better audience scores than Sora
+Gemini 2.0 Flash ushers in a new era of real-time multimodal AI
+Anthropic’s fastest model, Claude 3.5 Haiku, now generally available
+ServiceNow open sources Fast-LLM in a bid to help enterprises train AI models 20% quicker
+Lam Research launches collaborative robots to optimize critical maintenance in chip factories
+See how Google Gemini 2.0 Flash can perform hours of business analysis in minutes
+
+************
+
+llm model: Qwen/Qwen2.5-14B-Instruct
+hallucination times: 2
+total analysis time: 17.918839931488037
+
+author and publish time(not formated): {'source': 'Dean Takahashi', 'publish_date': '2024-12-16'}
+infos(not formated):
+
+more urls:
+Google Gemini 2.0: Could this be the beginning of truly autonomous AI?
+Synthetic data has its limits — why human-sourced data can help prevent AI model collapse
+Taryn Plumb
+Cohere’s smallest, fastest R-series model excels at RAG, reasoning in 23 languages
+Sapient debuts with new AI architectures, aiming to beat Transformers’ reasoning with recurrent neural networks
+Rick Song, Persona
+Google’s new Trillium AI chip delivers 4x speed and powers Gemini 2.0
+Anthropic’s fastest model, Claude 3.5 Haiku, now generally available
+Microsoft’s smaller AI model beats the big guys: Meet Phi-4, the efficiency king
+New LLM optimization technique slashes memory costs up to 75%
+ServiceNow open sources Fast-LLM in a bid to help enterprises train AI models 20% quicker
+Lam Research launches collaborative robots to optimize critical maintenance in chip factories
+Solos launches AirGo Vision — ChatGPT-enabled AI smart glasses with a camera
+Pin thinks AI can fix recruitment’s biggest problems — and it has the numbers to prove it
+Realtime AI video analysis app Lloyd will offer developer kit after passing 50,000 users
+
+************
+
+llm model: Qwen/Qwen2.5-Coder-7B-Instruct
+hallucination times: 3
+total analysis time: 7.104852914810181
+
+author and publish time(not formated): {'source': 'Dean Takahashi', 'publish_date': '2024-12-16'}
+infos(not formated):
+
+more urls:
+Data Management
+Cloud and Data Storage Security
+Data Security and Privacy
+Synthetic Data
+Text-to-Speech
+Computer Hardware Security
+Industrial Automation
+New LLM optimization technique slashes memory costs up to 75%
+Microsoft’s smaller AI model beats the big guys: Meet Phi-4, the efficiency king
+Google’s new Trillium AI chip delivers 4x speed and powers Gemini 2.0
+Solos launches AirGo Vision — ChatGPT-enabled AI smart glasses with a camera
+We’ve come a long way from RPA: How AI agents are revolutionizing automation
+Artificial Intelligence
+AI, ML and Deep Learning
+Big Data and Analytics
+OpenAI rolls out ChatGPT for iPhone in landmark AI integration with Apple
+OpenAI launches ChatGPT Projects, letting you organize files, chats in groups
+Business Process Automation
+Synthetic data has its limits — why human-sourced data can help prevent AI model collapse
+ServiceNow open sources Fast-LLM in a bid to help enterprises train AI models 20% quicker
+Automation
+See how Google Gemini 2.0 Flash can perform hours of business analysis in minutes
+Security
+Data Networks
+NLP
+Development Automation
+Network Security and Privacy
+Data Labelling
+Google Gemini 2.0: Could this be the beginning of truly autonomous AI?
+Nvidia unveils next-gen AI and industrial digitalization capabilities at Microsoft Ignite
+Google unveils AI coding assistant ‘Jules,’ promising autonomous bug fixes and faster development cycles
+Software Security
+OpenAI’s o1 model doesn’t show its thinking, giving open source an advantage
+Cohere’s smallest, fastest R-series model excels at RAG, reasoning in 23 languages
+Sapient debuts with new AI architectures, aiming to beat Transformers’ reasoning with recurrent neural networks
+Data Storage and Cloud
+Gemini 2.0 Flash ushers in a new era of real-time multimodal AI
+Anthropic’s fastest model, Claude 3.5 Haiku, now generally available
+Conversational AI
+Auto ML
+Data Science
+Data Infrastructure
+
+************
+
+llm model: 01-ai/Yi-1.5-34B-Chat-16K
+hallucination times: 1
+total analysis time: 19.41735577583313
+
+author and publish time(not formated): {}
+infos(not formated):
+大模型技术突破与创新: OpenAI扩展了ChatGPT Canvas的使用范围,ServiceNow开源了Fast-LLM以帮助企业更快地训练AI模型
+AI应用市场规模与增长预测: 无相关信息
+大模型落地行业应用趋势: Solos推出AirGo Vision智能眼镜,结合了ChatGPT技术,用于行业应用
+大模型企业应用案例: 无相关信息
+大模型创业故事: 无相关信息
+好用的AI工具及其适用的范围,和同类型工具对比: 无相关信息
+more urls:
+Data Management
+Google Gemini 2.0: Could this be the beginning of truly autonomous AI?
+Google’s new Trillium AI chip delivers 4x speed and powers Gemini 2.0
+New LLM optimization technique slashes memory costs up to 75%
+Microsoft’s smaller AI model beats the big guys: Meet Phi-4, the efficiency king
+Solos launches AirGo Vision — ChatGPT-enabled AI smart glasses with a camera
+OpenAI updates ChatGPT Search with voice queries, faster results, mobile maps integration
+Big Data and Analytics
+Nvidia unveils next-gen AI and industrial digitalization capabilities at Microsoft Ignite
+Google unveils AI coding assistant ‘Jules,’ promising autonomous bug fixes and faster development cycles
+OpenAI launches ChatGPT Projects, letting you organize files, chats in groups
+OpenAI’s o1 model doesn’t show its thinking, giving open source an advantage
+Cohere’s smallest, fastest R-series model excels at RAG, reasoning in 23 languages
+Sapient debuts with new AI architectures, aiming to beat Transformers’ reasoning with recurrent neural networks
+Data Storage and Cloud
+Gemini 2.0 Flash ushers in a new era of real-time multimodal AI
+Anthropic’s fastest model, Claude 3.5 Haiku, now generally available
+ServiceNow open sources Fast-LLM in a bid to help enterprises train AI models 20% quicker
+Lam Research launches collaborative robots to optimize critical maintenance in chip factories
+Data Science
+
+************
+
+raw materials: 3958ab
+
+llm model: Qwen/Qwen2.5-7B-Instruct
+hallucination times: 1
+total analysis time: 0.7024776935577393
+
+author and publish time(not formated): {'source': 'NA', 'publish_date': 'NA'}
+infos(not formated):
+
+more urls:
+
+
+************
+
+llm model: THUDM/glm-4-9b-chat
+hallucination times: 0
+total analysis time: 3.489488124847412
+
+author and publish time(not formated): {'source': 'MIT Technology Review', 'publish_date': 'NA'}
+infos(not formated):
+大模型技术突破与创新: The latest advances in the quest to build machines that can reason, learn, and act intelligently.
+大模型技术突破与创新: The latest iteration of a legacy Founded at the Massachusetts Institute of Technology in 1899, MIT Technology Review is a world-renowned, independent media company whose insight, analysis, reviews, interviews and live events explain the newest technologies and their commercial, social and political impact.
+more urls:
+Featured
+Topics
+READ ABOUT OUR HISTORY
+My subscription
+ADVERTISE WITH US
+Privacy policy
+Contact us
+MIT Alumni News
+Privacy Policy
+Subscribe
+MIT Technology Review
+Editorial guidelines
+International Editions
+Custom content
+Republishing
+Careers
+Advertise with us
+Audio
+Sign in
+Events
+Terms of Service
+Write for us
+Help & FAQ
+Newsletters
+
+************
+
+llm model: deepseek-ai/DeepSeek-V2.5
+hallucination times: 1
+total analysis time: 3.308987855911255
+
+author and publish time(not formated): {'source': 'MIT Technology Review', 'publish_date': 'NA'}
+infos(not formated):
+
+more urls:
+
+
+************
+
+llm model: Qwen/QwQ-32B-Preview
+hallucination times: 0
+total analysis time: 59.053231954574585
+
+author and publish time(not formated): {'source': 'MIT Technology Review', 'publish_date': 'NA'}
+infos(not formated):
+大模型技术突破与创新: The latest advances in the quest to build machines that can reason, learn, and act intelligently.
+AI应用市场规模与增长预测: MIT Technology Review is a world-renowned, independent media company whose insight, analysis, reviews, interviews and live events explain the newest technologies and their commercial, social and political impact.
+大模型落地行业应用趋势: From event sponsorships to custom content to visually arresting video storytelling, advertising with MIT Technology Review creates opportunities for your brand to resonate with an unmatched audience of technology and business elite.
+大模型企业应用案例: Elevate your brand to the forefront of conversation around emerging technologies that are radically transforming business.
+大模型创业故事: Founded at the Massachusetts Institute of Technology in 1899, MIT Technology Review is a world-renowned, independent media company whose insight, analysis, reviews, interviews and live events explain the newest technologies and their commercial, social and political impact.
+好用的AI工具及其适用的范围,和同类型工具的对比: The AlgorithmA weekly newsletter that helps demystify artificial intelligence.
+more urls:
+
+
+************
+
+llm model: Qwen/Qwen2.5-Coder-32B-Instruct
+hallucination times: 1
+total analysis time: 0.7454960346221924
+
+author and publish time(not formated): {'source': 'NA', 'publish_date': 'NA'}
+infos(not formated):
+
+more urls:
+
+
+************
+
+llm model: Qwen/Qwen2.5-32B-Instruct
+hallucination times: 1
+total analysis time: 1.29982590675354
+
+author and publish time(not formated): {'source': 'NA', 'publish_date': 'NA'}
+infos(not formated):
+
+more urls:
+
+
+************
+
+llm model: Qwen/Qwen2.5-14B-Instruct
+hallucination times: 1
+total analysis time: 1.0227909088134766
+
+author and publish time(not formated): {'source': 'MIT Technology Review', 'publish_date': 'NA'}
+infos(not formated):
+
+more urls:
+
+
+************
+
+llm model: Qwen/Qwen2.5-Coder-7B-Instruct
+hallucination times: 1
+total analysis time: 0.6058359146118164
+
+author and publish time(not formated): {'source': 'NA', 'publish_date': 'NA'}
+infos(not formated):
+
+more urls:
+
+
+************
+
+llm model: 01-ai/Yi-1.5-34B-Chat-16K
+hallucination times: 0
+total analysis time: 1.6967651844024658
+
+author and publish time(not formated): {'source': 'MIT Technology Review', 'publish_date': 'NA'}
+infos(not formated):
+大模型技术突破与创新: The latest advances in the quest to build machines that can reason, learn, and act intelligently.
+more urls:
+
+
+************
+
diff --git a/test/webpage_samples/_task3/407948/link_dict.json b/test/webpage_samples/_task3/407948/link_dict.json
new file mode 100644
index 0000000..1ca33ab
--- /dev/null
+++ b/test/webpage_samples/_task3/407948/link_dict.json
@@ -0,0 +1,177 @@
+{
+ "北极星电力网": "https://www.bjx.com.cn/",
+ "火电": "https://huodian.bjx.com.cn",
+ "风电": "https://fd.bjx.com.cn",
+ "光伏": "https://guangfu.bjx.com.cn",
+ "水电": "https://shuidian.bjx.com.cn",
+ "售电": "https://news.bjx.com.cn/rankinglist/shoudian/",
+ "储能": "https://news.bjx.com.cn/rankinglist/chuneng/",
+ "氢能": "https://news.bjx.com.cn/rankinglist/qingneng/",
+ "环保": "https://huanbao.bjx.com.cn",
+ "信息化": "https://xinxihua.bjx.com.cn/",
+ "智能电网": "https://news.bjx.com.cn/rankinglist/zndw/",
+ "核电": "https://news.bjx.com.cn/rankinglist/hedian/",
+ "综合能源服务": "https://news.bjx.com.cn/zhuanti/2019zhnyfw/",
+ "能源": "https://energy.bjx.com.cn/",
+ "输配电": "https://news.bjx.com.cn/rankinglist/shupeidian/",
+ "碳管家": "https://tanguanjia.bjx.com.cn/",
+ "农电": "https://nongdian.bjx.com.cn",
+ "电池": "https://news.bjx.com.cn/rankinglist/battery/",
+ "大气": "https://daqi.bjx.com.cn/",
+ "水处理": "https://scljob.bjx.com.cn",
+ "固废": "https://gfcl.bjx.com.cn/",
+ "节能": "https://jnjob.bjx.com.cn",
+ "垃圾发电": "https://ljfd.bjx.com.cn/",
+ "环境修复": "https://hjxfjob.bjx.com.cn",
+ "环境监测": "https://hjjc.bjx.com.cn/",
+ "环卫": "https://huanwei.bjx.com.cn/",
+ "VOCs": "https://vocs.bjx.com.cn/",
+ "北极星招聘": "https://hr.bjx.com.cn",
+ "电力": "https://dljob.bjx.com.cn",
+ "环保发电": "https://hbfdjob.bjx.com.cn",
+ "电力工程": "https://dlgcjob.bjx.com.cn",
+ "碳管理": "https://tanjob.bjx.com.cn",
+ "风电场投资及运营": "https://fdjob.bjx.com.cn/industry/flfd/",
+ "风电整机": "https://fdjob.bjx.com.cn/industry/fdzj/",
+ "叶片及材料": "https://fdjob.bjx.com.cn/industry/ypjcl/",
+ "风电工程": "https://fdjob.bjx.com.cn/industry/fedgc/",
+ "发电机及元件": "https://fdjob.bjx.com.cn/industry/fdjjyj/",
+ "塔筒/塔架": "https://fdjob.bjx.com.cn/industry/tttj/",
+ "控制系统": "https://fdjob.bjx.com.cn/industry/kzxt/",
+ "光伏电池组件": "https://gfjob.bjx.com.cn/industry/gfdcjzj/",
+ "光伏电站及运维": "https://gfjob.bjx.com.cn/industry/gfdz/",
+ "光伏逆变器": "https://gfjob.bjx.com.cn/industry/gfnbq/",
+ "分布式光伏": "https://gfjob.bjx.com.cn/industry/fbsgf/",
+ "工商业光伏": "https://gfjob.bjx.com.cn/industry/gsygf/",
+ "户用光伏": "https://gfjob.bjx.com.cn/industry/hygf/",
+ "光伏系统工程": "https://gfjob.bjx.com.cn/industry/gfgc/",
+ "光伏零部件": "https://gfjob.bjx.com.cn/industry/gfxtlbj/",
+ "光伏原材料及辅料": "https://gfjob.bjx.com.cn/industry/gfcljsb/",
+ "储能电池": "https://cnjob.bjx.com.cn/industry/cndc/",
+ "储能系统": "https://cnjob.bjx.com.cn/industry/cnjs/",
+ "储能电站": "https://cnjob.bjx.com.cn/industry/cndz/",
+ "工商业储能": "https://cnjob.bjx.com.cn/industry/gsycn/",
+ "储能工程": "https://cnjob.bjx.com.cn/industry/cngc/",
+ "储能材料及零部件": "https://cnjob.bjx.com.cn/industry/dccl/",
+ "光储充一体化": "https://cnjob.bjx.com.cn/industry/xnyqc/",
+ "户用储能": "https://cnjob.bjx.com.cn/industry/cnyy/",
+ "电池材料": "https://dccljob.bjx.com.cn",
+ "电池生产": "https://dcscjob.bjx.com.cn",
+ "电池应用": "https://dcyyjob.bjx.com.cn",
+ "电池回收": "https://dchsjob.bjx.com.cn",
+ "电池技术": "https://dcjsjob.bjx.com.cn",
+ "固废处理": "https://gfcljob.bjx.com.cn",
+ "大气治理": "https://dqzljob.bjx.com.cn",
+ "检测环评": "https://jchpjob.bjx.com.cn",
+ "环保工程": "https://hbgcjob.bjx.com.cn",
+ "环保设备": "https://hbsbjob.bjx.com.cn",
+ "电气": "https://dqjob.bjx.com.cn",
+ "自动化": "https://zdhjob.bjx.com.cn",
+ "电力信息化": "https://xxhjob.bjx.com.cn",
+ "工程": "https://gcjob.bjx.com.cn",
+ "工程设计": "https://sjjob.bjx.com.cn",
+ "工程监理": "https://jljob.bjx.com.cn",
+ "工程造价": "https://gczjjob.bjx.com.cn",
+ "市政路桥工程": "https://szlqjob.bjx.com.cn",
+ "建筑工程": "https://jzjob.bjx.com.cn",
+ "轨道工程": "https://gdjob.bjx.com.cn",
+ "机电工程": "https://jdjob.bjx.com.cn",
+ "直播": "https://tv.bjx.com.cn",
+ "公开课": "https://tv.bjx.com.cn/list/?type=2",
+ "空中宣讲": "https://tv.bjx.com.cn/list/?type=3",
+ "云招聘": "https://tv.bjx.com.cn/list/?type=4",
+ "星培计划": "https://tv.bjx.com.cn/list/?type=5",
+ "高端访谈": "https://tv.bjx.com.cn/list/?type=7",
+ "校企专访": "https://tv.bjx.com.cn/list/?type=8",
+ "课程": "https://edu.bjx.com.cn/course/0-0-0-0-0-1/",
+ "图书": "https://edu.bjx.com.cn/book/0-0-0-1/",
+ "线下活动": "https://edu.bjx.com.cn/activity/",
+ "学社APP": "https://news.bjx.com.cn/zt/app/index.html",
+ "电力商务通": "https://b2b.bjx.com.cn/",
+ "环保设备网": "https://hbshebei.bjx.com.cn/",
+ "北极星社区": "https://club.bjx.com.cn/",
+ "电力会展网": "https://ex.bjx.com.cn/",
+ "环保会展网": "https://huanbao.bjx.com.cn/ex",
+ "光伏会展网": "https://guangfu.bjx.com.cn/ex/",
+ "电力专题": "https://www.bjx.com.cn/zt/",
+ "环保专题": "https://huanbao.bjx.com.cn/zt/",
+ "新闻": "https://news.bjx.com.cn/",
+ "政策": "https://news.bjx.com.cn/zc/",
+ "招投标": "https://news.bjx.com.cn/zb/",
+ "项目": "https://news.bjx.com.cn/xm/",
+ "技术": "https://news.bjx.com.cn/js/",
+ "数据": "https://news.bjx.com.cn/sj/",
+ "报告": "https://news.bjx.com.cn/bg/",
+ "社区": "https://club.bjx.com.cn",
+ "下载": "https://download.bjx.com.cn/",
+ "市场": "https://news.bjx.com.cn/sc/",
+ "名企": "https://news.bjx.com.cn/mq/",
+ "独家": "https://news.bjx.com.cn/dj/",
+ "人物": "https://huanbao.bjx.com.cn/hbrw.shtml",
+ "评论": "https://news.bjx.com.cn/pl/",
+ "国际": "https://news.bjx.com.cn/gj/",
+ "招聘": "https://hr.bjx.com.cn/",
+ "学社": "https://edu.bjx.com.cn/",
+ "商务通": "https://b2b.bjx.com.cn/",
+ "专题": "http://www.bjx.com.cn/zt/",
+ "企业注册": "https://companycenter.bjx.com.cn/Account/Register/",
+ "企业登录": "https://companycenter.bjx.com.cn/Account/logon/",
+ "电力总榜": "https://news.bjx.com.cn/rankinglist/dianli/",
+ "火力发电": "https://news.bjx.com.cn/rankinglist/huodian/",
+ "风力发电": "https://news.bjx.com.cn/rankinglist/fengdian/",
+ "太阳能光伏": "https://news.bjx.com.cn/rankinglist/tyngf/",
+ "水力发电": "https://news.bjx.com.cn/rankinglist/shuidian/",
+ "全球首个绿氢多稳态竖炉工业化示范工程将在松原落地!": "https://news.bjx.com.cn/html/20241217/1417290.shtml",
+ "氢动科技助力交通强国建设": "https://news.bjx.com.cn/html/20241217/1417217.shtml",
+ "阳光氢能/中集扬州/盛氢制氢/派瑞氢能/京电设备/大陆制氢/华光环能入围中国能建葛洲坝公司制氢设备厂家名单!": "https://news.bjx.com.cn/html/20241217/1417323.shtml",
+ "总投资37亿!内蒙古通辽风光储氢氨一体化产业园示范项目开工!": "https://news.bjx.com.cn/html/20241217/1417362.shtml",
+ "50万吨绿色甲醇项目进度刷新!": "https://news.bjx.com.cn/html/20241217/1417280.shtml",
+ "清洁能源国际创新联盟成立!": "https://news.bjx.com.cn/html/20241217/1417261.shtml",
+ "全国首家氢能交易平台上线": "https://news.bjx.com.cn/html/20241217/1417365.shtml",
+ "二氧化碳耦合绿氢制甲醇 吉利创新中心牵手世界500强": "https://news.bjx.com.cn/html/20241217/1417357.shtml",
+ "年产10万吨绿氢制60万吨绿氨生产线项目设计招标!": "https://news.bjx.com.cn/html/20241217/1417312.shtml",
+ "中国能建中电工程与中核汇能签订战略合作协议!": "https://news.bjx.com.cn/html/20241217/1417299.shtml",
+ "隆基氢能与欧洲客户携手推进北欧重要氢能项目!": "https://news.bjx.com.cn/html/20241217/1417359.shtml",
+ "1.44万吨绿氢项目!新疆俊瑞富蕴县绿氢项目中标结果公示!": "https://news.bjx.com.cn/html/20241217/1417374.shtml",
+ "广元发展集团“氢”装上阵 抢跑“零碳”新赛道": "https://news.bjx.com.cn/html/20241217/1417220.shtml",
+ "总投资158.5亿!盐城吉电绿氢制储运加用一体化示范项目加速推进": "https://news.bjx.com.cn/html/20241217/1417364.shtml",
+ "河北迁安:发展氢能产业助力绿色发展": "https://news.bjx.com.cn/html/20241217/1417363.shtml",
+ "中能建加快推进通辽科尔沁左翼后期20万吨绿色甲醇项目": "https://news.bjx.com.cn/html/20241217/1417366.shtml",
+ "中国钢研签署纯氢冶金项目": "https://news.bjx.com.cn/html/20241217/1417395.shtml",
+ "我国首个工厂化海水直接制氢科研项目建成!": "https://news.bjx.com.cn/html/20241216/1416935.shtml",
+ "青海发布加快推动氢能产业高质量发展的若干政策措施": "https://news.bjx.com.cn/html/20241216/1416925.shtml",
+ "加氢站运营补贴150万元/年!浙江临海市氢能产业发展扶持政策征意见": "https://news.bjx.com.cn/html/20241216/1416942.shtml",
+ "一场奇妙的职场冒险,缺你不可!运维类岗位热招中": "https://gfjob.bjx.com.cn/specials/101782.html",
+ "12月校招急聘专场,更快找到offer": "https://dljob.bjx.com.cn/specials/101812.html",
+ "12月央/国企最新校招专场": "https://dljob.bjx.com.cn/specials/101807.html",
+ "应届生冬季实习专场": "https://dljob.bjx.com.cn/specials/101810.html",
+ "告别漫长等待!这些企业处理简历速度快极了": "https://gfjob.bjx.com.cn/specials/101809.html",
+ "四川二滩建设咨询有限公司在招安全监理工程师、光伏运维人员(站长、值长、运维工程师)等8个职位": "https://hr.bjx.com.cn/companys/52594/jobs_0_1/",
+ "河南省同信电力工程有限公司在招风电/光伏项目场长、风电/光伏项目经理等51个职位": "https://hr.bjx.com.cn/companys/113324/jobs_0_1/",
+ "中蒲电力集团有限公司在招保洁、清舱、工程车司机等11个职位": "https://hr.bjx.com.cn/companys/125067/jobs_0_1/",
+ "徐州云迈环保科技有限公司在招钳工、生产计划/物料管理(PMC)/BOM物料清单管理工程师(大厂)等140个职位": "https://hr.bjx.com.cn/companys/135499/jobs_0_1/",
+ "深圳市远信储能技术有限公司在招电站运维工程师、逆变器结构工程师等10个职位": "https://hr.bjx.com.cn/companys/158359/jobs_0_1/",
+ "更多>": "https://edu.bjx.com.cn",
+ "课程集中式光伏项目全流程支持性文件概述": "https://edu.bjx.com.cn/s/67109308.html",
+ "课程储能电站安全运维管理方案": "https://edu.bjx.com.cn/s/67109294.html",
+ "课程锂离子电池储能中的安全问题及应对技术(限时免费)": "https://edu.bjx.com.cn/s/67109353.html",
+ "课程光伏电站股权收购的流程和风险分析": "https://edu.bjx.com.cn/s/67109396.html",
+ "课程《零碳生态&绿色未来》系列公益公开课": "https://edu.bjx.com.cn/s/67109299.html",
+ "课程分布式光伏电站建设“避坑指南”": "https://edu.bjx.com.cn/s/67109355.html",
+ "在线直播": "https://tv.bjx.com.cn/",
+ "关于北极星": "http://www.bjx.com.cn/about/about.html",
+ "广告服务": "http://www.bjx.com.cn/about/baojia_index.html",
+ "会员服务": "https://companycenter.bjx.com.cn/common/hybz",
+ "营销方案": "http://www.bjx.com.cn/about/yxfa.html",
+ "网站地图": "https://map.bjx.com.cn/",
+ "成功案例": "http://www.bjx.com.cn/about/about.html?=#s6",
+ "联系我们": "http://www.bjx.com.cn/about/lxwm.html",
+ "京ICP证080169号": "http://img.mybjx.net/theme/default/images/common/renzeng/icp1.jpg",
+ "京ICP备09003304号-2": "https://beian.miit.gov.cn/#/Integrated/index",
+ "京公网安备11010502034458号": "http://www.beian.gov.cn/portal/registerSystemInfo?recordcode=11010502034458",
+ "电子公告服务专项备案": "https://www.bjx.com.cn/icp.html",
+ "广播电视节目制作经营许可证 (京) 字第13229号": "http://img.mybjx.net/theme/default/images/common/renzeng/gbjmzz.jpg",
+ "出版物经营许可证新出发京批字第直200384号": "http://img.mybjx.net/theme/default/images/common/renzeng/cbwjy.jpg",
+ "人力资源服务许可证1101052014340号": "http://img.mybjx.net/theme/default/images/common/renzeng/hrrlzyxk.jpg",
+ "北京火山动力网络技术有限公司": "http://img.mybjx.net/theme/default/images/common/renzeng/yingyezhizheng.jpg"
+}
\ No newline at end of file
diff --git a/test/webpage_samples/_task3/407948/screenshot.jpg b/test/webpage_samples/_task3/407948/screenshot.jpg
new file mode 100644
index 0000000..26d10b9
Binary files /dev/null and b/test/webpage_samples/_task3/407948/screenshot.jpg differ
diff --git a/test/webpage_samples/_task3/407948/text.txt b/test/webpage_samples/_task3/407948/text.txt
new file mode 100644
index 0000000..d37d41d
--- /dev/null
+++ b/test/webpage_samples/_task3/407948/text.txt
@@ -0,0 +1,262 @@
+新闻政策招投标项目技术火电风电光伏储能售电招聘学社直播商务通专题
+企业注册企业登录个人注册个人登录
+北极星氢能排行榜
+
+为您提供更方便,更快捷的优质内容查找途径
+
+电力总榜火力发电风力发电太阳能光伏水力发电核电储能电池输配电氢能智能电网售电
+今日本周本月
+1
+全球首个绿氢多稳态竖炉工业化示范工程将在松原落地!
+
+来源:吉林省人民政府网7小时前
+
+12月16日,吉林省委书记黄强,省委副书记、省长胡玉亭在长春会见中国钢研科技集团党委书记、董事长张少明和总经理高宏斌一行,并见证省政府、松原市政府分别与中国钢研签署战略合作框架协议、纯氢冶金项目合作协议。黄强、胡玉亭向张少明、高宏斌一行表示欢迎,对中国钢研给予吉林的大力支持表示感谢。
+
+2
+氢动科技助力交通强国建设
+
+来源:氢动科技10小时前
+
+2024年2月20日,中华人民共和国交通运输部发布公告:《交通运输部关于国家电力投资集团有限公司开展重卡换电站建设组网与运营示范等交通强国建设试点工作的意见》。意见明确指出开展“氢燃料电池研发与氢能交通运营平台应用”建设试点。同时,氢动科技在宁波舟山港承担绿色港航物流示范项目建设。氢动
+
+3
+阳光氢能/中集扬州/盛氢制氢/派瑞氢能/京电设备/大陆制氢/华光环能入围中国能建葛洲坝公司制氢设备厂家名单!
+
+来源:中国能建电子采购平台5小时前
+
+12月16日,中国能建葛洲坝油气公司制氢设备预采购公告发布,预采购范围:制氢设备,包括1000Nm3/h碱性电解槽、气液分离装置、纯化装置、补水配碱装置1套,两年期运维服务。设备生产厂家限定如下范围:(1)阳光氢能科技有限公司(2)中集中电(扬州)制氢设备有限公司(3)广东盛氢制氢设备有限公司(4
+
+04
+总投资37亿!内蒙古通辽风光储氢氨一体化产业园示范项目开工!
+
+来源:通辽统计微讯3小时前
+
+近日,内蒙古天楹能源有限公司投资建设的风光储氢氨一体化产业园示范项目开工建设,项目位于内蒙古通辽市科左中旗产业园宝龙山工业园区内。项目总投资37.0亿元,建设内容为新建一座氢氨工厂及其配套设施,共配置33套制氢单元,每个单元配置4套1000Nm3/h电解槽设备。合成氨建设规模为45万吨/年,其分为3
+
+05
+50万吨绿色甲醇项目进度刷新!
+
+来源:北极星氢能网8小时前
+
+近日,北极星氢能网获悉,金风科技兴安盟风电耦合制50万吨绿色甲醇项目基地已初具雏形。该项目于2024年在兴安盟经济技术开发区启动建设,项目总投资30亿元,占地超1800亩。该项目创新应用风—氢—储—生物质多能协同耦合技术,打通了新能源制氢向化工行业的发展通道。建成投产后,将依托200万千瓦风电
+
+06
+清洁能源国际创新联盟成立!
+
+来源:北极星氢能网9小时前
+
+12月17日,2024绿色航运大会在海南盛大开幕。会议上,清洁能源国际创新联盟成立。清洁能源国际创新联盟是在海南省发展和改革委员会支持下,由西门子能源、国家能源集团海南电力有限公司和海南国际经济发展局三方倡议发起,由企业、专业机构和国际性社会组织自愿组成的国际化行业性社会组织,旨在推动清
+
+07
+全国首家氢能交易平台上线
+
+来源:美锦能源3小时前
+
+北极星氢能网获悉,12月16日,美锦能源举行全国首家氢能交易平台上线仪式。中国氢能交易平台将围绕制氢厂、物流企业、气体贸易商、加氢站、工业客户等主要用户,提供价格资讯发布、线上挂牌与交易、线上签约与支付结算功能,为供需双方提供一站式交易服务。实现了氢能产业与数字化技术的深度融合,促进
+
+08
+二氧化碳耦合绿氢制甲醇 吉利创新中心牵手世界500强
+
+来源:宁波前湾新区发布4小时前
+
+近日,吉利创新中心与世界500强企业霍尼韦尔签署战略合作协议,双方将基于各自优势,在二氧化碳捕集、捕集二氧化碳耦合绿氢制取电子甲醇、电子甲醇制取可持续航空燃料SAF技术合作以及其他服务于高质量低碳可持续发展的先进技术等多个领域达成了合作意向。用绿色甲醇破解世界能源和双碳难题,吉利创新中
+
+09
+年产10万吨绿氢制60万吨绿氨生产线项目设计招标!
+
+来源:北极星氢能网6小时前
+
+新疆氢基能源科技沙湾市年产10万吨绿氢制60万吨绿氨生产线项目工程设计招标公告新疆氢基能源科技有限公司成立于2024年08月27日,注册地位于新疆塔城地区沙湾市哈拉干德工业园区产业孵化园黄河路1-48号,法定代表人为范华伟。经营范围包括一般项目:技术服务、技术开发、技术咨询、技术交流、技术转让、
+
+10
+中国能建中电工程与中核汇能签订战略合作协议!
+
+来源:中国能建中电工程6小时前
+
+12月16日,中国能建首席科学家,中电工程党委书记、董事长,电规总院院长罗必雄与中核汇能有限公司党委书记、董事长张焰座谈,双方围绕大通道大基地的项目开发、工程建设等方面进行深入交流并见证签约。中核汇能党委委员、副总经理欧阳朝晖,中电工程党委常委、副总经理王新平代表双方签署战略合作协议
+
+11
+隆基氢能与欧洲客户携手推进北欧重要氢能项目!
+
+来源:隆基氢能3小时前
+
+12月17日,北极星氢能网获悉,隆基氢能近期与某欧洲客户成功签订电解槽系统采购订单,将为位于挪威的具有里程碑意义的绿氢项目提供多台套千立方级的安全、高效、低电耗的Hi1系列电解槽及其辅助系统(BoP)。该项目计划于2026年开始运营,通过以电子燃料(e-fuels)替代化石燃料,为全球气候目标的实现
+
+12
+1.44万吨绿氢项目!新疆俊瑞富蕴县绿氢项目中标结果公示!
+
+来源:中国招标投标公共服务平台2小时前
+
+北极星氢能网获悉,12月16日,新疆俊瑞富蕴县新能源规模化制绿氢项目设计采购施工一体化总承包中标结果公示,中标人:中建三局第三建设工程有限责任公司,项目资金为124286万元。项目规模:年产1.44万吨绿氢。总规划面积为199998平方米,总建筑面积87998平方米,建(构)筑物基地面积64400平方米,道路硬
+
+13
+广元发展集团“氢”装上阵 抢跑“零碳”新赛道
+
+来源:广元市国资委10小时前
+
+在“双碳”目标的时代大考与绿色发展的浪潮之下,广元发展集团紧扣市委、市政府赋予的定位与主责主业,将发展新质生产力作为首要关键任务,在氢能产业这片新“蓝海”中破浪前行,全力加快布局,为广元市抢占“零碳”发展先机注入强劲动力。广元发展集团深刻领悟发展氢能产业对于我国践行“碳达峰、碳中
+
+14
+总投资158.5亿!盐城吉电绿氢制储运加用一体化示范项目加速推进
+
+来源:中国大丰港3小时前
+
+近日,在盐城吉电绿氢制储运加用一体化示范项目建设现场,呈现出一片热火朝天的繁忙景象。机械的轰鸣声、工具的碰撞声、工人的呼喊声交织在一起,奏响了一曲激昂的建设乐章,工人们都在争分夺秒地加速施工,全力以赴确保项目如期高质量完成。该项目计划总投资158.5亿元,规划用地1000亩,分三期逐步推
+
+15
+河北迁安:发展氢能产业助力绿色发展
+
+来源:新华网3小时前
+
+北极星氢能网获悉,12月15日,工人在河北省迁安市一家氢燃料电池发动机企业的生产车间工作。近年来,河北省迁安市加快培育氢能产业,打造制氢、氢燃料电池发动机制造基地,推行氢燃料重卡运输大宗货物,助力绿色低碳发展。据介绍,目前该市年产车用氢气9000多吨、重卡氢燃料电池发动机5000台,区域内投
+
+16
+中能建加快推进通辽科尔沁左翼后期20万吨绿色甲醇项目
+
+来源:能建氢能3小时前
+
+北极星氢能网获悉,近日,中能建氢能源有限公司党委书记、董事长李京光在通辽市拜访通辽市委副书记、市长奇·达楞太,双方围绕加快推进通辽科尔沁左翼后期20万吨绿色甲醇项目以及打造通辽市氢能产业链集群等问题进行深入交流,并达成广泛共识。奇·达楞太对李京光一行的到访表示欢迎,对2024年6月18日
+
+17
+中国钢研签署纯氢冶金项目
+
+来源:中国钢研37分钟前
+
+北极星氢能网获悉,12月16日,中国钢研与吉林省政府、松原市政府分别签署战略合作框架协议、纯氢冶金项目合作协议。中国钢研党委书记、董事长张少明介绍了中国钢研建设的全球首条5万吨纯氢冶金示范工程。该工程对我国高端钢铁新材料和钢铁行业低碳发展、绿电及绿氢规模化消纳、资源综合开发利用和资源
+
+18
+我国首个工厂化海水直接制氢科研项目建成!
+
+来源:青岛西海岸发布昨天
+
+北极星氢能网获悉,12月13日,我国首个工厂化海水直接制氢科研项目在青岛西海岸新区青岛炼化氢能“产研加”示范园内建成试运行。据了解,此次建成的海水制氢项目,由青岛炼化和中石化大连院共同开发建设,是我国首次直接在石化园区实施并实现产品回收应用的百千瓦级工厂化海水制氢项目。项目采用“海水
+
+19
+青海发布加快推动氢能产业高质量发展的若干政策措施
+
+来源:青海省发展和改革委员会昨天
+
+北极星氢能网获悉,12月10日,青海省发展和改革委员会发布了《青海省加快推动氢能产业高质量发展的若干政策措施》的通知。通知指出:加快推进关键核心技术攻关,对符合要求氢能领域科技成果转化和示范应用项目,积极申请国家超长期国债资金支持。积极发展可再生能源制氢。在落实氢能应用场景的前提下,
+
+20
+加氢站运营补贴150万元/年!浙江临海市氢能产业发展扶持政策征意见
+
+来源:临海市人民政府昨天
+
+北极星氢能网获悉,12月13日,浙江临海市发布《临海市氢能产业发展扶持政策》(征求意见稿)。该扶持政策的征求意见稿指出,支持氢能项目投资。对临海市氢能产业投资项目:生产性设备投资额500万元(含)以上的,按设备投资额的15%给予补助,最高500万元;生产性设备投资额500万元以下的,按设备投资额的
+
+最新热点
+中国钢研签署纯氢冶金项目
+1.44万吨绿氢项目!新疆俊瑞富蕴县绿氢项目中标结果公示!
+中能建加快推进通辽科尔沁左翼后期20万吨绿色甲醇项目
+全国首家氢能交易平台上线
+总投资158.5亿!盐城吉电绿氢制储运加用一体化示范项目加速推进
+河北迁安:发展氢能产业助力绿色发展
+总投资37亿!内蒙古通辽风光储氢氨一体化产业园示范项目开工!
+隆基氢能与欧洲客户携手推进北欧重要氢能项目!
+二氧化碳耦合绿氢制甲醇 吉利创新中心牵手世界500强
+阳光氢能/中集扬州/盛氢制氢/派瑞氢能/京电设备/大陆制氢/华光环能入围中国能建葛洲坝公司制氢设备厂家名单!
+招聘
+更多>
+
+一场奇妙的职场冒险,缺你不可!运维类岗位热招中
+
+12月校招急聘专场,更快找到offer
+
+12月央/国企最新校招专场
+
+应届生冬季实习专场
+
+告别漫长等待!这些企业处理简历速度快极了
+
+一场奇妙的职场冒险,缺你不可!运维类岗位热招中
+
+12月校招急聘专场,更快找到offer
+
+四川二滩建设咨询有限公司在招安全监理工程师、光伏运维人员(站长、值长、运维工程师)等8个职位
+绩效奖金 | 带薪年假 | 交通补助
+
+河南省同信电力工程有限公司在招风电/光伏项目场长、风电/光伏项目经理等51个职位
+
+中蒲电力集团有限公司在招保洁、清舱、工程车司机等11个职位
+绩效奖金 | 定期体检 | 节日礼物
+
+徐州云迈环保科技有限公司在招钳工、生产计划/物料管理(PMC)/BOM物料清单管理工程师(大厂)等140个职位
+
+深圳市远信储能技术有限公司在招电站运维工程师、逆变器结构工程师等10个职位
+年底双薪 | 绩效奖金 | 带薪年假
+
+学社
+更多>
+课程
+
+集中式光伏项目全流程支持性文件概述
+
+课程
+
+储能电站安全运维管理方案
+
+课程
+
+锂离子电池储能中的安全问题及应对技术(限时免费)
+
+课程
+
+光伏电站股权收购的流程和风险分析
+
+课程
+
+《零碳生态&绿色未来》系列公益公开课
+
+课程
+
+分布式光伏电站建设“避坑指南”
+
+便捷入口
+
+在线直播
+
+招聘服务
+
+北极星学社
+
+关于我们
+
+关于北极星
+
+广告服务
+
+会员服务
+
+营销方案
+
+网站地图
+
+成功案例
+
+联系我们
+
+网站运营
+
+北京火山动力网络技术有限公司
+
+北京市朝阳区世通国际大厦C座12层
+
+广告合作:崔女士 18911066791
+
+陈女士 17701031159
+
+合作投稿:陈女士 13693626116
+
+会展合作:齐女士 13381061157
+
+会员咨询:李先生 17718308761
+
+法务邮箱:fw@bjxmail.com
+
+京ICP证080169号京ICP备09003304号-2京公网安备11010502034458号电子公告服务专项备案
+
+广播电视节目制作经营许可证 (京) 字第13229号出版物经营许可证新出发京批字第直200384号人力资源服务许可证1101052014340号
+
+Copyright © 2024 Bjx.com.cn All Rights Reserved. 北京火山动力网络技术有限公司 版权所有
\ No newline at end of file
diff --git a/test/webpage_samples/_task3/focus_point.json b/test/webpage_samples/_task3/focus_point.json
new file mode 100644
index 0000000..197dfb8
--- /dev/null
+++ b/test/webpage_samples/_task3/focus_point.json
@@ -0,0 +1,2 @@
+[{"focuspoint": "新获批的氢能项目", "explanation": ""},
+{"focuspoint": "新投产的氢能项目", "explanation": ""}]
\ No newline at end of file
diff --git a/test/webpage_samples/_task3/record-2024-12-18-19-53-59.txt b/test/webpage_samples/_task3/record-2024-12-18-19-53-59.txt
new file mode 100644
index 0000000..2e9121a
--- /dev/null
+++ b/test/webpage_samples/_task3/record-2024-12-18-19-53-59.txt
@@ -0,0 +1,269 @@
+focus statement: #新获批的氢能项目
+#新投产的氢能项目
+
+
+raw materials: 407948
+
+llm model: Qwen/Qwen2.5-7B-Instruct
+hallucination times: 1
+total analysis time: 25.593686819076538
+
+author and publish time(not formated): {'source': '吉林省人民政府网', 'publish_date': '2023-12-17'}
+infos(not formated):
+新获批的氢能项目: 北极星氢能排行榜为您提供更方便,更快捷的优质内容查找途径电力总榜火力发电风力发电太阳能光伏水力发电核电储能电池输配电氢能智能电网售电今日本周本月1全球首个绿氢多稳态竖炉工业化示范工程将在松原落地!来源:吉林省人民政府网7小时前12月16日,吉林省委书记黄强,省委副书记、省长胡玉亭在长春会见中国钢研科技集团党委书记、董事长张少明和总经理高宏斌一行,并见证省政府、松原市政府分别与中国钢研签署战略合作框架协议、纯氢冶金项目合作协议。黄强、胡玉亭向张少明、高宏斌一行表示欢迎,对中国钢研给予吉林的大力支持表示感谢。3总投资37亿!内蒙古通辽风光储氢氨一体化产业园示范项目开工!来源:通辽统计微讯3小时前近日,内蒙古天楹能源有限公司投资建设的风光储氢氨一体化产业园示范项目开工建设,项目位于内蒙古通辽市科左中旗产业园宝龙山工业园区内。项目总投资37.0亿元,建设内容为新建一座氢氨工厂及其配套设施,共配置33套制氢单元,每个单元配置4套1000Nm3/h电解槽设备。合成氨建设规模为45万吨/年,其分为30550万吨绿色甲醇项目进度刷新!来源:北极星氢能网8小时前近日,北极星氢能网获悉,金风科技兴安盟风电耦合制50万吨绿色甲醇项目基地已初具雏形。该项目于2024年在兴安盟经济技术开发区启动建设,项目总投资30亿元,占地超1800亩。该项目创新应用风—氢—储—生物质多能协同耦合技术,打通了新能源制氢向化工行业的发展通道。建成投产后,将依托200万千瓦风电06清洁能源国际创新联盟成立!来源:北极星氢能网9小时前12月17日,2024绿色航运大会在海南盛大开幕。会议上,清洁能源国际创新联盟成立。清洁能源国际创新联盟是在海南省发展和改革委员会支持下,由西门子能源、国家能源集团海南电力有限公司和海南国际经济发展局三方倡议发起,由企业、专业机构和国际性社会组织自愿组成的国际化行业性社会组织,旨在推动清07全国首家氢能交易平台上线来源:美锦能源3小时前北极星氢能网获悉,12月16日,美锦能源举行全国首家氢能交易平台上线仪式。中国氢能交易平台将围绕制氢厂、物流企业、气体贸易商、加氢站、工业客户等主要用户,提供价格资讯发布、线上挂牌与交易、线上签约与支付结算功能,为供需双方提供一站式交易服务。实现了氢能产业与数字化技术的深度融合,促进08二氧化碳耦合绿氢制甲醇 吉利创新中心牵手世界500强来源:宁波前湾新区发布4小时前近日,吉利创新中心与世界500强企业霍尼韦尔签署战略合作协议,双方将基于各自优势,在二氧化碳捕集、捕集二氧化碳耦合绿氢制取电子甲醇、电子甲醇制取可持续航空燃料SAF技术合作以及其他服务于高质量低碳可持续发展的先进技术等多个领域达成了合作意向。用绿色甲醇破解世界能源和双碳难题,吉利创新中09年产10万吨绿氢制60万吨绿氨生产线项目设计招标!来源:北极星氢能网6小时前新疆氢基能源科技沙湾市年产10万吨绿氢制60万吨绿氨生产线项目工程设计招标公告新疆氢基能源科技有限公司成立于2024年08月27日,注册地位于新疆塔城地区沙湾市哈拉干德工业园区产业孵化园黄河路1-48号,法定代表人为范华伟。经营范围包括一般项目:技术服务、技术开发、技术咨询、技术交流、技术转让、11隆基氢能与欧洲客户携手推进北欧重要氢能项目!来源:隆基氢能3小时前12月17日,北极星氢能网获悉,隆基氢能近期与某欧洲客户成功签订电解槽系统采购订单,将为位于挪威的具有里程碑意义的绿氢项目提供多台套千立方级的安全、高效、低电耗的Hi1系列电解槽及其辅助系统(BoP)。该项目计划于2026年开始运营,通过以电子燃料(e-fuels)替代化石燃料,为全球气候目标的实现
+新获批的氢能项目: 121.44万吨绿氢项目!新疆俊瑞富蕴县绿氢项目中标结果公示!来源:中国招标投标公共服务平台2小时前北极星氢能网获悉,12月16日,新疆俊瑞富蕴县新能源规模化制绿氢项目设计采购施工一体化总承包中标结果公示,中标人:中建三局第三建设工程有限责任公司,项目资金为124286万元。项目规模:年产1.44万吨绿氢。总规划面积为199998平方米,总建筑面积87998平方米,建(构)筑物基地面积64400平方米,道路硬化面积135598平方米。
+新投产的氢能项目: 总投资158.5亿!盐城吉电绿氢制储运加用一体化示范项目加速推进来源:中国大丰港3小时前近日,在盐城吉电绿氢制储运加用一体化示范项目建设现场,呈现出一片热火朝天的繁忙景象。机械的轰鸣声、工具的碰撞声、工人们的呼喊声交织在一起,奏响了一曲激昂的建设乐章,工人们都在争分夺秒地加速施工,全力以赴确保项目如期高质量完成。该项目计划总投资158.5亿元,规划用地1000亩,分三期逐步推进。
+more urls:
+储能
+全球首个绿氢多稳态竖炉工业化示范工程将在松原落地!
+1.44万吨绿氢项目!新疆俊瑞富蕴县绿氢项目中标结果公示!
+总投资158.5亿!盐城吉电绿氢制储运加用一体化示范项目加速推进
+总投资37亿!内蒙古通辽风光储氢氨一体化产业园示范项目开工!
+氢能
+年产10万吨绿氢制60万吨绿氨生产线项目设计招标!
+
+************
+
+llm model: THUDM/glm-4-9b-chat
+hallucination times: 0
+total analysis time: 73.42666482925415
+
+author and publish time(not formated): {'source': '吉林省人民政府网', 'publish_date': '7小时前'}
+infos(not formated):
+新投产的氢能项目: 内蒙古通辽风光储氢氨一体化产业园示范项目开工建设,项目总投资37.0亿元,建设内容为新建一座氢氨工厂及其配套设施,共配置33套制氢单元,每个单元配置4套1000Nm3/h电解槽设备。
+新投产的氢能项目: 金风科技兴安盟风电耦合制50万吨绿色甲醇项目基地已初具雏形。该项目于2024年在兴安盟经济技术开发区启动建设,项目总投资30亿元,占地超1800亩。
+新投产的氢能项目: 新疆氢基能源科技沙湾市年产10万吨绿氢制60万吨绿氨生产线项目工程设计招标公告新疆氢基能源科技有限公司成立于2024年08月27日,注册地位于新疆塔城地区沙湾市哈拉干德工业园区产业孵化园黄河路1-48号,法定代表人为范华伟。
+新获批的氢能项目: 新疆俊瑞富蕴县绿氢项目中标结果公示!项目规模:年产1.44万吨绿氢。
+新投产的氢能项目: 盐城吉电绿氢制储运加用一体化示范项目加速推进。该项目计划总投资158.5亿元,规划用地1000亩,分三期逐步推进。
+新投产的氢能项目: 河北迁安:发展氢能产业助力绿色发展。目前该市年产车用氢气9000多吨、重卡氢燃料电池发动机5000台。
+新投产的氢能项目: 中能建加快推进通辽科尔沁左翼后期20万吨绿色甲醇项目。
+新投产的氢能项目: 中国钢研签署纯氢冶金项目。中国钢研建设的全球首条5万吨纯氢冶金示范工程。
+新投产的氢能项目: 我国首个工厂化海水直接制氢科研项目建成!由青岛炼化和中石化大连院共同开发建设。
+新投产的氢能项目: 青海发布加快推动氢能产业高质量发展的若干政策措施。
+新投产的氢能项目: 加氢站运营补贴150万元/年!浙江临海市氢能产业发展扶持政策征意见。
+新获批的氢能项目: 无相关内容
+新投产的氢能项目: 无相关内容
+more urls:
+课程储能电站安全运维管理方案
+河南省同信电力工程有限公司在招风电/光伏项目场长、风电/光伏项目经理等51个职位
+总投资37亿!内蒙古通辽风光储氢氨一体化产业园示范项目开工!
+全球首个绿氢多稳态竖炉工业化示范工程将在松原落地!
+总投资158.5亿!盐城吉电绿氢制储运加用一体化示范项目加速推进
+全国首家氢能交易平台上线
+我国首个工厂化海水直接制氢科研项目建成!
+年产10万吨绿氢制60万吨绿氨生产线项目设计招标!
+课程分布式光伏电站建设“避坑指南”
+广元发展集团“氢”装上阵 抢跑“零碳”新赛道
+课程集中式光伏项目全流程支持性文件概述
+青海发布加快推动氢能产业高质量发展的若干政策措施
+50万吨绿色甲醇项目进度刷新!
+课程光伏电站股权收购的流程和风险分析
+中能建加快推进通辽科尔沁左翼后期20万吨绿色甲醇项目
+隆基氢能与欧洲客户携手推进北欧重要氢能项目!
+阳光氢能/中集扬州/盛氢制氢/派瑞氢能/京电设备/大陆制氢/华光环能入围中国能建葛洲坝公司制氢设备厂家名单!
+课程锂离子电池储能中的安全问题及应对技术(限时免费)
+北京火山动力网络技术有限公司
+深圳市远信储能技术有限公司在招电站运维工程师、逆变器结构工程师等10个职位
+氢动科技助力交通强国建设
+1.44万吨绿氢项目!新疆俊瑞富蕴县绿氢项目中标结果公示!
+二氧化碳耦合绿氢制甲醇 吉利创新中心牵手世界500强
+加氢站运营补贴150万元/年!浙江临海市氢能产业发展扶持政策征意见
+
+************
+
+llm model: deepseek-ai/DeepSeek-V2.5
+hallucination times: 1
+total analysis time: 89.749685049057
+
+author and publish time(not formated): {'source': '吉林省人民政府网', 'publish_date': '2023-12-16'}
+infos(not formated):
+新获批的氢能项目: 12月16日,吉林省委书记黄强,省委副书记、省长胡玉亭在长春会见中国钢研科技集团党委书记、董事长张少明和总经理高宏斌一行,并见证省政府、松原市政府分别与中国钢研签署战略合作框架协议、纯氢冶金项目合作协议。
+新获批的氢能项目: 2024年2月20日,中华人民共和国交通运输部发布公告:《交通运输部关于国家电力投资集团有限公司开展重卡换电站建设组网与运营示范等交通强国建设试点工作的意见》。意见明确指出开展“氢燃料电池研发与氢能交通运营平台应用”建设试点。
+新获批的氢能项目: 12月16日,中国能建葛洲坝油气公司制氢设备预采购公告发布,预采购范围:制氢设备,包括1000Nm3/h碱性电解槽、气液分离装置、纯化装置、补水配碱装置1套,两年期运维服务。
+新获批的氢能项目: 近日,内蒙古天楹能源有限公司投资建设的风光储氢氨一体化产业园示范项目开工建设,项目位于内蒙古通辽市科左中旗产业园宝龙山工业园区内。项目总投资37.0亿元,建设内容为新建一座氢氨工厂及其配套设施,共配置33套制氢单元,每个单元配置4套1000Nm3/h电解槽设备。
+新获批的氢能项目: 近日,北极星氢能网获悉,金风科技兴安盟风电耦合制50万吨绿色甲醇项目基地已初具雏形。该项目于2024年在兴安盟经济技术开发区启动建设,项目总投资30亿元,占地超1800亩。
+新获批的氢能项目: 12月17日,2024绿色航运大会在海南盛大开幕。会议上,清洁能源国际创新联盟成立。
+新获批的氢能项目: 12月16日,美锦能源举行全国首家氢能交易平台上线仪式。
+新获批的氢能项目: 近日,吉利创新中心与世界500强企业霍尼韦尔签署战略合作协议,双方将基于各自优势,在二氧化碳捕集、捕集二氧化碳耦合绿氢制取电子甲醇、电子甲醇制取可持续航空燃料SAF技术合作以及其他服务于高质量低碳可持续发展的先进技术等多个领域达成了合作意向。
+新获批的氢能项目: 新疆氢基能源科技沙湾市年产10万吨绿氢制60万吨绿氨生产线项目工程设计招标公告
+新获批的氢能项目: 12月16日,中国能建首席科学家,中电工程党委书记、董事长,电规总院院长罗必雄与中核汇能有限公司党委书记、董事长张焰座谈,双方围绕大通道大基地的项目开发、工程建设等方面进行深入交流并见证签约。
+新获批的氢能项目: 12月17日,北极星氢能网获悉,隆基氢能近期与某欧洲客户成功签订电解槽系统采购订单,将为位于挪威的具有里程碑意义的绿氢项目提供多台套千立方级的安全、高效、低电耗的Hi1系列电解槽及其辅助系统(BoP)。
+新投产的氢能项目: 121.44万吨绿氢项目!新疆俊瑞富蕴县绿氢项目中标结果公示!
+more urls:
+储能
+课程储能电站安全运维管理方案
+总投资158.5亿!盐城吉电绿氢制储运加用一体化示范项目加速推进
+户用储能
+储能系统
+总投资37亿!内蒙古通辽风光储氢氨一体化产业园示范项目开工!
+光储充一体化
+全球首个绿氢多稳态竖炉工业化示范工程将在松原落地!
+储能工程
+储能电站
+我国首个工厂化海水直接制氢科研项目建成!
+年产10万吨绿氢制60万吨绿氨生产线项目设计招标!
+储能材料及零部件
+1.44万吨绿氢项目!新疆俊瑞富蕴县绿氢项目中标结果公示!
+储能电池
+深圳市远信储能技术有限公司在招电站运维工程师、逆变器结构工程师等10个职位
+氢能
+工商业储能
+
+************
+
+llm model: Qwen/QwQ-32B-Preview
+hallucination times: 0
+total analysis time: 67.79002976417542
+
+author and publish time(not formated): {'source': '吉林省人民政府网', 'publish_date': '2024-02-16'}
+infos(not formated):
+新获批的氢能项目: 全球首个绿氢多稳态竖炉工业化示范工程将在松原落地!来源:吉林省人民政府网7小时前12月16日,吉林省委书记黄强,省委副书记、省长胡玉亭在长春会见中国钢研科技集团党委书记、董事长张少明和总经理高宏斌一行,并见证省政府、松原市政府分别与中国钢研签署战略合作框架协议、纯氢冶金项目合作协议。
+新获批的氢能项目: 氢动科技助力交通强国建设来源:氢动科技10小时前2024年2月20日,中华人民共和国交通运输部发布公告:《交通运输部关于国家电力投资集团有限公司开展重卡换电站建设组网与运营示范等交通强国建设试点工作的意见》。意见明确指出开展“氢燃料电池研发与氢能交通运营平台应用”建设试点。同时,氢动科技在宁波舟山港承担绿色港航物流示范项目建设。
+新获批的氢能项目: 阳光氢能/中集扬州/盛氢制氢/派瑞氢能/京电设备/大陆制氢/华光环能入围中国能建葛洲坝公司制氢设备厂家名单!来源:中国能建电子采购平台5小时前12月16日,中国能建葛洲坝油气公司制氢设备预采购公告发布,预采购范围:制氢设备,包括1000Nm3/h碱性电解槽、气液分离装置、纯化装置、补水配碱装置1套,两年期运维服务。设备生产厂家限定如下范围:(1)阳光氢能科技有限公司(2)中集中电(扬州)制氢设备有限公司(3)广东盛氢制氢设备有限公司(4)
+新投产的氢能项目: 总投资37亿!内蒙古通辽风光储氢氨一体化产业园示范项目开工!来源:通辽统计微讯3小时前近日,内蒙古天楹能源有限公司投资建设的风光储氢氨一体化产业园示范项目开工建设,项目位于内蒙古通辽市科左中旗产业园宝龙山工业园区内。项目总投资37.0亿元,建设内容为新建一座氢氨工厂及其配套设施,共配置33套制氢单元,每个单元配置4套1000Nm3/h电解槽设备。合成氨建设规模为45万吨/年,其分为30
+新投产的氢能项目: 50万吨绿色甲醇项目进度刷新!来源:北极星氢能网8小时前近日,北极星氢能网获悉,金风科技兴安盟风电耦合制50万吨绿色甲醇项目基地已初具雏形。该项目于2024年在兴安盟经济技术开发区启动建设,项目总投资30亿元,占地超1800亩。该项目创新应用风—氢—储—生物质多能协同耦合技术,打通了新能源制氢向化工行业的发展通道。建成投产后,将依托200万千瓦风电06清洁能源国际创新联盟成立!来源:北极星氢能网9小时前12月17日,2024绿色航运大会在海南盛大开幕。会议上,清洁能源国际创新联盟成立。清洁能源国际创新联盟是在海南省发展和改革委员会支持下,由西门子能源、国家能源集团海南电力有限公司和海南国际经济发展局三方倡议发起,由企业、专业机构和国际性社会组织自愿组成的国际化行业性社会组织,旨在推动清07全国首家氢能交易平台上线来源:美锦能源3小时前北极星氢能网获悉,12月16日,美锦能源举行全国首家氢能交易平台上线仪式。中国氢能交易平台将围绕制氢厂、物流企业、气体贸易商、加氢站、工业客户等主要用户,提供价格资讯发布、线上挂牌与交易、线上签约与支付结算功能,为供需双方提供一站式交易服务。实现了氢能产业与数字化技术的深度融合,促进08二氧化碳耦合绿氢制甲醇 吉利创新中心牵手世界500强来源:宁波前湾新区发布4小时前近日,吉利创新中心与世界500强企业霍尼韦尔签署战略合作协议,双方将基于各自优势,在二氧化碳捕集、捕集二氧化碳耦合绿氢制取电子甲醇、电子甲醇制取可持续航空燃料SAF技术合作以及其他服务于高质量低碳可持续发展的先进技术等多个领域达成了合作意向。用绿色甲醇破解世界能源和双碳难题,吉利创新中09年产10万吨绿氢制60万吨绿氨生产线项目设计招标!来源:北极星氢能网6小时前新疆氢基能源科技沙湾市年产10万吨绿氢制60万吨绿氨生产线项目工程设计招标公告新疆氢基能源科技有限公司成立于2024年08月27日,注册地位于新疆塔城地区沙湾市哈拉干德工业园区产业孵化园黄河路1-48号,法定代表人为范华伟。经营范围包括一般项目:技术服务、技术开发、技术咨询、技术交流、技术转让、10中国能建中电工程与中核汇能签订战略合作协议!来源:中国能建中电工程6小时前12月16日,中国能建首席科学家,中电工程党委书记、董事长,电规总院院长罗必雄与中核汇能有限公司党委书记、董事长张焰座谈,双方围绕大通道大基地的项目开发、工程建设等方面进行深入交流并见证签约。中核汇能党委委员、副总经理欧阳朝晖,中电工程党委常委、副总经理王新平代表双方签署战略合作协议11隆基氢能与欧洲客户携手推进北欧重要氢能项目!来源:隆基氢能3小时前12月17日,北极星氢能网获悉,隆基氢能近期与某欧洲客户成功签订电解槽系统采购订单,将为位于挪威的具有里程碑意义的绿氢项目提供多台套千立方级的安全、高效、低电耗的Hi1系列电解槽及其辅助系统(BoP)。该项目计划于2026年开始运营,通过以电子燃料(e-fuels)替代化石燃料,为全球气候目标的实现
+新获批的氢能项目: 新疆俊瑞富蕴县绿氢项目中标结果公示,项目资金为124286万元,年产1.44万吨绿氢。
+新投产的氢能项目: 广元发展集团在氢能产业中破浪前行,加快布局,为广元市抢占“零碳”发展先机注入强劲动力。
+新获批的氢能项目: 盐城吉电绿氢制储运加用一体化示范项目加速推进,计划总投资158.5亿元,分三期逐步推进。
+新投产的氢能项目: 河北迁安发展氢能产业,打造制氢、氢燃料电池发动机制造基地,推行氢燃料重卡运输大宗货物,助力绿色低碳发展。
+新获批的氢能项目: 中能建加快推进通辽科尔沁左翼后期20万吨绿色甲醇项目,与吉林省政府、松原市政府签署战略合作框架协议和纯氢冶金项目合作协议。
+新投产的氢能项目: 中国钢研与吉林省政府、松原市政府签署纯氢冶金项目合作协议,建设全球首条5万吨纯氢冶金示范工程。
+新获批的氢能项目: 我国首个工厂化海水直接制氢科研项目在青岛西海岸新区建成试运行,是我国首次直接在石化园区实施并实现产品回收应用的百千瓦级工厂化海水制氢项目。
+新获批的氢能项目: 青海省发布加快推动氢能产业高质量发展的若干政策措施,加快推进关键核心技术攻关,支持可再生能源制氢。
+新获批的氢能项目: 浙江临海市发布《临海市氢能产业发展扶持政策》(征求意见稿),支持氢能项目投资,对生产性设备投资额给予补助。
+新获批的氢能项目: 无相关信息
+新投产的氢能项目: 无相关信息
+more urls:
+
+
+************
+
+llm model: Qwen/Qwen2.5-Coder-32B-Instruct
+hallucination times: 4
+total analysis time: 5.307005405426025
+
+author and publish time(not formated): {}
+infos(not formated):
+
+more urls:
+总投资158.5亿!盐城吉电绿氢制储运加用一体化示范项目加速推进
+总投资37亿!内蒙古通辽风光储氢氨一体化产业园示范项目开工!
+全球首个绿氢多稳态竖炉工业化示范工程将在松原落地!
+
+************
+
+llm model: Qwen/Qwen2.5-32B-Instruct
+hallucination times: 1
+total analysis time: 33.703696727752686
+
+author and publish time(not formated): {'source': '吉林省人民政府网', 'publish_date': 'NA'}
+infos(not formated):
+新获批的氢能项目: 全球首个绿氢多稳态竖炉工业化示范工程将在松原落地!来源:吉林省人民政府网7小时前12月16日,吉林省委书记黄强,省委副书记、省长胡玉亭在长春会见中国钢研科技集团党委书记、董事长张少明和总经理高宏斌一行,并见证省政府、松原市政府分别与中国钢研签署战略合作框架协议、纯氢冶金项目合作协议。
+新获批的氢能项目: 氢动科技在宁波舟山港承担绿色港航物流示范项目建设。
+新投产的氢能项目: 金风科技兴安盟风电耦合制50万吨绿色甲醇项目基地已初具雏形。该项目于2024年在兴安盟经济技术开发区启动建设,项目总投资30亿元,占地超1800亩。该项目创新应用风—氢—储—生物质多能协同耦合技术,打通了新能源制氢向化工行业的发展通道。建成投产后,将依托200万千瓦风电
+新获批的氢能项目: 总投资37亿!内蒙古通辽风光储氢氨一体化产业园示范项目开工!来源:通辽统计微讯3小时前近日,内蒙古天楹能源有限公司投资建设的风光储氢氨一体化产业园示范项目开工建设,项目位于内蒙古通辽市科左中旗产业园宝龙山工业园区内。项目总投资37.0亿元,建设内容为新建一座氢氨工厂及其配套设施,共配置33套制氢单元,每个单元配置4套1000Nm3/h电解槽设备。合成氨建设规模为45万吨/年,其分为30550万吨绿色甲醇项目进度刷新!来源:北极星氢能网8小时前近日,北极星氢能网获悉,金风科技兴安盟风电耦合制50万吨绿色甲醇项目基地已初具雏形。该项目于2024年在兴安盟经济技术开发区启动建设,项目总投资30亿元,占地超1800亩。该项目创新应用风—氢—储—生物质多能协同耦合技术,打通了新能源制氢向化工行业的发展通道。建成投产后,将依托200万千瓦风电
+新获批的氢能项目: 新疆氢基能源科技沙湾市年产10万吨绿氢制60万吨绿氨生产线项目工程设计招标公告新疆氢基能源科技有限公司成立于2024年08月27日,注册地位于新疆塔城地区沙湾市哈拉干德工业园区产业孵化园黄河路1-48号,法定代表人为范华伟。经营范围包括一般项目:技术服务、技术开发、技术咨询、技术交流、技术转让、
+新获批的氢能项目: 121.44万吨绿氢项目!新疆俊瑞富蕴县绿氢项目中标结果公示!来源:中国招标投标公共服务平台2小时前北极星氢能网获悉,12月16日,新疆俊瑞富蕴县新能源规模化制绿氢项目设计采购施工一体化总承包中标结果公示,中标人:中建三局第三建设工程有限责任公司,项目资金为124286万元。项目规模:年产1.44万吨绿氢。总规划面积为199998平方米,总建筑面积87998平方米,建(构)筑物基地面积64400平方米,道路硬13
+新获批的氢能项目: 总投资158.5亿!盐城吉电绿氢制储运加用一体化示范项目加速推进来源:中国大丰港3小时前近日,在盐城吉电绿氢制储运加用一体化示范项目建设现场,呈现出一片热火朝天的繁忙景象。机械的轰鸣声、工具的碰撞声、工人的呼喊声交织在一起,奏响了一曲激昂的建设乐章,工人们都在争分夺秒地加速施工,全力以赴确保项目如期高质量完成。该项目计划总投资158.5亿元,规划用地1000亩,分三期逐步推15
+新获批的氢能项目: 中能建加快推进通辽科尔沁左翼后期20万吨绿色甲醇项目来源:能建氢能3小时前北极星氢能网获悉,近日,中能建氢能源有限公司党委书记、董事长李京光在通辽市拜访通辽市委副书记、市长奇·达楞太,双方围绕加快推进通辽科尔沁左翼后期20万吨绿色甲醇项目以及打造通辽市氢能产业链集群等问题进行深入交流,并达成广泛共识。奇·达楞太对李京光一行的到访表示欢迎,对2024年6月18日17
+新获批的氢能项目: 我国首个工厂化海水直接制氢科研项目建成!来源:青岛西海岸发布昨天北极星氢能网获悉,12月13日,我国首个工厂化海水直接制氢科研项目在青岛西海岸新区青岛炼化氢能“产研加”示范园内建成试运行。据了解,此次建成的海水制氢项目,由青岛炼化和中石化大连院共同开发建设,是我国首次直接在石化园区实施并实现产品回收应用的百千瓦级工厂化海水制氢项目。项目采用“海水19
+more urls:
+1.44万吨绿氢项目!新疆俊瑞富蕴县绿氢项目中标结果公示!
+总投资158.5亿!盐城吉电绿氢制储运加用一体化示范项目加速推进
+总投资37亿!内蒙古通辽风光储氢氨一体化产业园示范项目开工!
+全球首个绿氢多稳态竖炉工业化示范工程将在松原落地!
+
+************
+
+llm model: Qwen/Qwen2.5-14B-Instruct
+hallucination times: 1
+total analysis time: 11.236259937286377
+
+author and publish time(not formated): {'source': '吉林省人民政府网', 'publish_date': '2023-12-16'}
+infos(not formated):
+新获批的氢能项目: 《交通运输部关于国家电力投资集团有限公司开展重卡换电站建设组网与运营示范等交通强国建设试点工作的意见》。意见明确指出开展“氢燃料电池研发与氢能交通运营平台应用”建设试点。
+新投产的氢能项目: 内蒙古通辽风光储氢氨一体化产业园示范项目开工建设
+新投产的氢能项目: 金风科技兴安盟风电耦合制50万吨绿色甲醇项目基地已初具雏形
+新投产的氢能项目: 美锦能源举行全国首家氢能交易平台上线仪式
+新投产的氢能项目: 吉利创新中心与世界500强企业霍尼韦尔签署战略合作协议
+新投产的氢能项目: 新疆氢基能源科技沙湾市年产10万吨绿氢制60万吨绿氨生产线项目工程设计招标
+新投产的氢能项目: 隆基氢能与欧洲客户成功签订电解槽系统采购订单,将为位于挪威的具有里程碑意义的绿氢项目提供多台套千立方级的安全、高效、低电耗的Hi1系列电解槽及其辅助系统(BoP)
+新获批的氢能项目: 121.44万吨绿氢项目!新疆俊瑞富蕴县绿氢项目中标结果公示!中标人:中建三局第三建设工程有限责任公司,项目资金为124286万元。项目规模:年产1.44万吨绿氢。总规划面积为199998平方米,总建筑面积87998平方米,建(构)筑物基地面积64400平方米,道路硬化面积13000平方米。
+新投产的氢能项目: 总投资158.5亿!盐城吉电绿氢制储运加用一体化示范项目加速推进。该项目计划总投资158.5亿元,规划用地1000亩,分三期逐步推进。
+more urls:
+总投资158.5亿!盐城吉电绿氢制储运加用一体化示范项目加速推进
+户用储能
+储能系统
+总投资37亿!内蒙古通辽风光储氢氨一体化产业园示范项目开工!
+光储充一体化
+全球首个绿氢多稳态竖炉工业化示范工程将在松原落地!
+储能工程
+储能电站
+年产10万吨绿氢制60万吨绿氨生产线项目设计招标!
+储能材料及零部件
+1.44万吨绿氢项目!新疆俊瑞富蕴县绿氢项目中标结果公示!
+储能电池
+氢能
+工商业储能
+
+************
+
+llm model: Qwen/Qwen2.5-Coder-7B-Instruct
+hallucination times: 1
+total analysis time: 7.4840919971466064
+
+author and publish time(not formated): {'source': '吉林省人民政府网', 'publish_date': '2023-12-16'}
+infos(not formated):
+新获批的氢能项目: 内蒙古通辽风光储氢氨一体化产业园示范项目开工!
+新投产的氢能项目: 06清洁能源国际创新联盟成立!
+新获批的氢能项目: 12月16日,新疆俊瑞富蕴县新能源规模化制绿氢项目设计采购施工一体化总承包中标结果公示,中标人:中建三局第三建设工程有限责任公司,项目资金为124286万元。项目规模:年产1.44万吨绿氢。总规划面积为199998平方米,总建筑面积87998平方米,建(构)筑物基地面积64400平方米,道路硬13广元发展集团“氢”装上阵 抢跑“零碳”新赛道来源:广元市国资委10小时前在“双碳”目标的时代大考与绿色发展的浪潮之下,广元发展集团紧扣市委、市政府赋予的定位与主责主业,将发展新质生产力作为首要关键任务,在氢能产业这片新“蓝海”中破浪前行,全力加快布局,为广元市抢占“零碳”发展先机注入强劲动力。广元发展集团深刻领悟发展氢能产业对于我国践行“碳达峰、碳中和”目标的重要意义。
+新投产的氢能项目: 158.5亿!盐城吉电绿氢制储运加用一体化示范项目加速推进来源:中国大丰港3小时前近日,在盐城吉电绿氢制储运加用一体化示范项目建设现场,呈现出一片热火朝天的繁忙景象。机械的轰鸣声、工具的碰撞声、工人的呼喊声交织在一起,奏响了一曲激昂的建设乐章,工人们都在争分夺秒地加速施工,全力以赴确保项目如期高质量完成。该项目计划总投资158.5亿元,规划用地1000亩,分三期逐步推进。
+more urls:
+总投资158.5亿!盐城吉电绿氢制储运加用一体化示范项目加速推进
+总投资37亿!内蒙古通辽风光储氢氨一体化产业园示范项目开工!
+全球首个绿氢多稳态竖炉工业化示范工程将在松原落地!
+河北迁安:发展氢能产业助力绿色发展
+广元发展集团“氢”装上阵 抢跑“零碳”新赛道
+1.44万吨绿氢项目!新疆俊瑞富蕴县绿氢项目中标结果公示!
+氢能
+50万吨绿色甲醇项目进度刷新!
+加氢站运营补贴150万元/年!浙江临海市氢能产业发展扶持政策征意见
+
+************
+
+llm model: 01-ai/Yi-1.5-34B-Chat-16K
+hallucination times: 1
+total analysis time: 24.476562976837158
+
+author and publish time(not formated): {}
+infos(not formated):
+新获批的氢能项目: 吉林省委书记黄强,省委副书记、省长胡玉亭在长春会见中国钢研科技集团党委书记、董事长张少明和总经理高宏斌一行,并见证省政府、松原市政府分别与中国钢研签署战略合作框架协议、纯氢冶金项目合作协议。
+新投产的氢能项目: 内蒙古天楹能源有限公司投资建设的风光储氢氨一体化产业园示范项目开工建设,项目位于内蒙古通辽市科左中旗产业园宝龙山工业园区内。项目总投资37.0亿元,建设内容为新建一座氢氨工厂及其配套设施,共配置33套制氢单元,每个单元配置4套1000Nm3/h电解槽设备。
+新获批的氢能项目: 中国能建葛洲坝油气公司制氢设备预采购公告发布,预采购范围:制氢设备,包括1000Nm3/h碱性电解槽、气液分离装置、纯化装置、补水配碱装置1套,两年期运维服务。设备生产厂家限定如下范围:(1)阳光氢能科技有限公司(2)中集中电(扬州)制氢设备有限公司(3)广东盛氢制氢设备有限公司
+新投产的氢能项目: 金风科技兴安盟风电耦合制50万吨绿色甲醇项目基地已初具雏形。该项目于2024年在兴安盟经济技术开发区启动建设,项目总投资30亿元,占地超1800亩。该项目创新应用风—氢—储—生物质多能协同耦合技术,打通了新能源制氢向化工行业的发展通道。
+新投产的氢能项目: 新疆氢基能源科技沙湾市年产10万吨绿氢制60万吨绿氨生产线项目工程设计招标公告
+新获批的氢能项目: 中国能建首席科学家,中电工程党委书记、董事长,电规总院院长罗必雄与中核汇能有限公司党委书记、董事长张焰座谈,双方围绕大通道大基地的项目开发、工程建设等方面进行深入交流并见证签约。
+新投产的氢能项目: 隆基氢能近期与某欧洲客户成功签订电解槽系统采购订单,将为位于挪威的具有里程碑意义的绿氢项目提供多台套千立方级的安全、高效、低电耗的Hi1系列电解槽及其辅助系统(BoP)。该项目计划于2026年开始运营,通过以电子燃料(e-fuels)替代化石燃料,为全球气候目标的实现
+新获批的氢能项目: 新疆俊瑞富蕴县新能源规模化制绿氢项目,中标人:中建三局第三建设工程有限责任公司,项目资金为124286万元,项目规模:年产1.44万吨绿氢。
+新投产的氢能项目: 盐城吉电绿氢制储运加用一体化示范项目,计划总投资158.5亿元,规划用地1000亩,分三期逐步推进。
+新投产的氢能项目: 河北迁安市加快培育氢能产业,打造制氢、氢燃料电池发动机制造基地,推行氢燃料重卡运输大宗货物,助力绿色低碳发展。
+新投产的氢能项目: 中能建加快推进通辽科尔沁左翼后期20万吨绿色甲醇项目。
+新投产的氢能项目: 中国钢研与吉林省政府、松原市政府分别签署战略合作框架协议、纯氢冶金项目合作协议。
+新投产的氢能项目: 我国首个工厂化海水直接制氢科研项目在青岛西海岸新区青岛炼化氢能‘产研加’示范园内建成试运行。
+新投产的氢能项目: 青海省发展和改革委员会发布了《青海省加快推动氢能产业高质量发展的若干政策措施》的通知。
+新投产的氢能项目: 浙江临海市发布《临海市氢能产业发展扶持政策》(征求意见稿)。
+more urls:
+课程储能电站安全运维管理方案
+总投资37亿!内蒙古通辽风光储氢氨一体化产业园示范项目开工!
+全球首个绿氢多稳态竖炉工业化示范工程将在松原落地!
+全国首家氢能交易平台上线
+河北迁安:发展氢能产业助力绿色发展
+课程分布式光伏电站建设“避坑指南”
+深圳市远信储能技术有限公司在招电站运维工程师、逆变器结构工程师等10个职位
+课程《零碳生态&绿色未来》系列公益公开课
+氢能
+青海发布加快推动氢能产业高质量发展的若干政策措施
+课程光伏电站股权收购的流程和风险分析
+
+************
+
diff --git a/test/webpage_samples/_task4/bd6dae/link_dict.json b/test/webpage_samples/_task4/bd6dae/link_dict.json
new file mode 100644
index 0000000..2f5a5f2
--- /dev/null
+++ b/test/webpage_samples/_task4/bd6dae/link_dict.json
@@ -0,0 +1,116 @@
+{
+ "News": "https://cryptopanic.com/",
+ "Rising": "https://cryptopanic.com/news?filter=rising",
+ "Media": "https://cryptopanic.com/news/media",
+ "Polls": "https://cryptopanic.com/polls/new",
+ "Portfolio": "https://cryptopanic.com/portfolio",
+ "Get PRO": "https://cryptopanic.com/pro",
+ "Sign In": "https://cryptopanic.com/accounts/login/",
+ "Sign Up": "https://cryptopanic.com/accounts/signup/",
+ "Go PRO": "https://cryptopanic.com/pro/",
+ "Develop": "https://cryptopanic.com/developers/",
+ "API": "https://cryptopanic.com/developers/api/about",
+ "Bots": "https://cryptopanic.com/developers/bots/",
+ "Widgets": "https://cryptopanic.com/developers/widgets/",
+ "Careers": "https://cryptopanic.com/careers/",
+ "Guides": "https://cryptopanic.com/guides/",
+ "Bizz Hub": "https://cryptopanic.com/partnership-hub/",
+ "Submit": "https://cryptopanic.com/submit-source",
+ "Top News": "https://cryptopanic.com/news",
+ "All News": "https://cryptopanic.com/news/all",
+ "Blogs": "https://cryptopanic.com/news/blogs",
+ "News Sites": "https://cryptopanic.com/news/news-sites",
+ "Following": "https://cryptopanic.com/news/following",
+ "Price Analysis": "https://cryptopanic.com/news/price-analysis",
+ "Regulation": "https://cryptopanic.com/news/regulation",
+ "ICO News": "https://cryptopanic.com/news/ico-news",
+ "Events": "https://cryptopanic.com/news/events",
+ "Commented": "https://cryptopanic.com/news?filter=commented",
+ "Hot!": "https://cryptopanic.com/news?filter=hot",
+ "Bullish": "https://cryptopanic.com/news?filter=bullish",
+ "Bearish": "https://cryptopanic.com/news?filter=bearish",
+ "Important": "https://cryptopanic.com/news?filter=important",
+ "LOL": "https://cryptopanic.com/news?filter=lol",
+ "Top Saved": "https://cryptopanic.com/news?filter=saved",
+ "BTC $106,766 2.80%": "https://cryptopanic.com/news/bitcoin/",
+ "ETH $3995.9 1.93%": "https://cryptopanic.com/news/ethereum/",
+ "XRP $2.70 14.33%": "https://cryptopanic.com/news/ripple/",
+ "USDT $1.00 -0.04%": "https://cryptopanic.com/news/tether/",
+ "SOL $222.03 3.57%": "https://cryptopanic.com/news/solana/",
+ "590%+225FS Bonus at BetFury: PLAY & WIN NOW🚀: 8000+ Slots, Live Casino, Sportsbook🎰 The best Vip Club & Transfer Program. Get Weekly&Monthly Bonuses. 25% Cashback. Crypto Staking: EARN up to 200%🤑": "https://betfury.bet/d91b3b7d3",
+ "***": "https://cryptopanic.com/news/20388493/Comprehensive-Sportsbook-Casino-Welcome-Bonus-7-BTC-250-Free-Spins-Play-without-KYC",
+ "15min": "https://cryptopanic.com/news/20416727/ETH-Breaking-the-004-level-on-the-ETHBTC-pair-would-be-confirmation-for-me-that-well-get-another-big-altcoin-leg-up-ETH-is-always-the-leader-in-a-big-altcoin-dominance-push-Historically-Q1-has-been-bullish-for-the-ETHBTC-ratio-I-think-the-market-is-shaping-up-nicely",
+ "ETH": "https://cryptopanic.com/news/bridged-wrapped-ether-starkgate/",
+ "17min": "https://cryptopanic.com/news/20416875/Idle-Mine-Game-Guide-Tips-to-Earn-More-Bitcoin-on-iOS-and-Android",
+ "18min": "https://cryptopanic.com/news/20416866/Daily-Discussion-Megathread-December-17-2024-GMT0",
+ "21min": "https://cryptopanic.com/news/20416627/Austrian-Police-Uncover-12-Million-Rip-Deal-20-Crypto-Fraud",
+ "26min": "https://cryptopanic.com/news/20416626/No-to-CBDC-yes-to-Bitcoin-European-MP-calls-for-EU-BTC-reserve",
+ "27min": "https://cryptopanic.com/news/20416609/This-Little-Known-DOJ-Rule-Often-Leaves-Crypto-Fraud-Victims-Empty-Handed-Bloomberg-Law",
+ "31min": "https://cryptopanic.com/news/20416654/Bitcoin-News-Riot-Platforms-Expands-Holdings-to-17429-BTC",
+ "33min": "https://cryptopanic.com/news/20416601/Bybit-To-Stop-Services-in-France-Effective-January-8-2025",
+ "34min": "https://cryptopanic.com/news/20416653/Aave-Community-Considers-Proposal-to-Exit-Polygon",
+ "AAVE": "https://cryptopanic.com/news/aave/",
+ "39min": "https://cryptopanic.com/news/20416556/Exodus-to-List-on-the-NYSE-American",
+ "41min": "https://cryptopanic.com/news/20416600/Ethereum-Foundation-Dump-Another-100-ETH-for-420k-ETH-Price-to-Drop",
+ "44min": "https://cryptopanic.com/news/20416539/Spot-Crypto-ETFs-in-2025-Is-Solana-Ripple-and-Cardano-Next",
+ "48min": "https://cryptopanic.com/news/20416582/Binance-Announces-Support-for-Major-Terra-Luna-Classic-Upgrade",
+ "LUNC": "https://cryptopanic.com/news/terra-luna/",
+ "51min": "https://cryptopanic.com/news/20416533/ZetaChain-Launches-Gateway-to-Simplify-Universal-Yield-DEX-Aggregation-and-More",
+ "ZETA": "https://cryptopanic.com/news/zetachain/",
+ "52min": "https://cryptopanic.com/news/20416546/Bitcoin-ETFs-top-gold-in-total-assets-within-a-year-of-launch",
+ "56min": "https://cryptopanic.com/news/20416510/XRP-off-to-the-races-to-hit-4-according-to-crypto-analyst",
+ "1h": "https://cryptopanic.com/news/20416427/Bitcoin-Price-Prediction-2025-Can-BTC-Rally-to-150K-by-Mid-Year",
+ "ATH": "https://cryptopanic.com/news/athenadao-token/",
+ "ASF": "https://cryptopanic.com/news/asymmetry-finance/",
+ "CRO": "https://cryptopanic.com/news/crypto-com-chain/",
+ "2h": "https://cryptopanic.com/news/20416295/FTX-Payouts-Begin-January-3rd-2025",
+ "CRV": "https://cryptopanic.com/news/curve-dao-token/",
+ "CPOOL": "https://cryptopanic.com/news/clearpool/",
+ "BIG": "https://cryptopanic.com/news/big/",
+ "RWA": "https://cryptopanic.com/news/rwa-inc/",
+ "About": "https://cryptopanic.com/about/",
+ "NordVPN Christmas Campaign - Special Offer: Up to 74% off + 3 extra months, starting at $2.99 / 2.99 €": "https://go.nordvpn.net/aff_c?offer_id=417&aff_id=112455&url_id=11870",
+ "3h": "https://cryptopanic.com/news/20415929/Riot-Platforms-Buys-69M-in-Bitcoin-Hits-17429-BTC",
+ "4h": "https://cryptopanic.com/news/20415853/FTX-to-Start-Creditor-Repayments-on-January-3",
+ "5h": "https://cryptopanic.com/news/20415667/Breaking-News-Indias-Parliament-Discusses-Comprehensive-Crypto-Framework",
+ "13h": "https://cryptopanic.com/news/20414624/Charles-Hoskinson-says-Cardano-is-ready-to-take-over-the-world",
+ "ADA": "https://cryptopanic.com/news/cardano/",
+ "Trending Poll Show more": "https://cryptopanic.com/polls",
+ "Will bitcoin pump because Donald trump's presidential inauguration?": "https://cryptopanic.com/polls/20366587/Will-bitcoin-pump-because-Donald-trumps-presidential-inauguration",
+ "47_m.naufal": "https://cryptopanic.com/47_m.naufal/",
+ "Bitget Token": "https://cryptopanic.com/news/bitget-token/",
+ "Stellar": "https://cryptopanic.com/news/stellar/",
+ "TRON": "https://cryptopanic.com/news/tron/",
+ "Hedera": "https://cryptopanic.com/news/hedera-hashgraph/",
+ "Hyperliquid": "https://cryptopanic.com/news/hyperliquid/",
+ "VeChain": "https://cryptopanic.com/news/vechain/",
+ "Mantle": "https://cryptopanic.com/news/mantle/",
+ "Aptos": "https://cryptopanic.com/news/aptos/",
+ "Chainlink": "https://cryptopanic.com/news/chainlink/",
+ "Kaspa": "https://cryptopanic.com/news/kaspa/",
+ "MANTRA": "https://cryptopanic.com/news/mantra-dao/",
+ "Artificial Superintelligence Alliance": "https://cryptopanic.com/news/fetch-ai/",
+ "Bittensor": "https://cryptopanic.com/news/bittensor/",
+ "USDS": "https://cryptopanic.com/news/usds/",
+ "Uniswap": "https://cryptopanic.com/news/uniswap/",
+ "Ethena USDe": "https://cryptopanic.com/news/ethena-usde/",
+ "donation": "https://cryptopanic.com/donate/",
+ "Discord": "https://cryptopanic.com/discord/",
+ "Telegram": "https://t.me/CryptoPanicCom",
+ "Advertise": "https://cryptopanic.com/advertise/",
+ "Contact": "https://cryptopanic.com/contact/",
+ "Terms": "https://cryptopanic.com/terms/",
+ "MC $3.93T 2.83%": "https://cryptopanic.com/news/market-cap/",
+ "BNB $719.61 1.82%": "https://cryptopanic.com/news/binancecoin/",
+ "DOGE $0.405 2.37%": "https://cryptopanic.com/news/dogecoin/",
+ "USDC $1.000 -0.00%": "https://cryptopanic.com/news/usd-coin/",
+ "STETH $3986.8 1.87%": "https://cryptopanic.com/news/staked-ether/",
+ "AVAX $50.26 3.21%": "https://cryptopanic.com/news/avalanche-2/",
+ "WSTETH $4742.5 1.84%": "https://cryptopanic.com/news/wrapped-steth/",
+ "SHIB $0.000 1.98%": "https://cryptopanic.com/news/shiba-inu/",
+ "TON $6.12 1.50%": "https://cryptopanic.com/news/the-open-network/",
+ "WBTC $106,418 2.83%": "https://cryptopanic.com/news/wrapped-bitcoin/",
+ "SUI $4.75 1.91%": "https://cryptopanic.com/news/sui/",
+ "Privacy Policy": "https://cryptopanic.com/privacy/",
+ "Cookie Notice": "https://cryptopanic.com/cookies-privacy/"
+}
\ No newline at end of file
diff --git a/test/webpage_samples/_task4/bd6dae/screenshot.jpg b/test/webpage_samples/_task4/bd6dae/screenshot.jpg
new file mode 100644
index 0000000..2a19868
Binary files /dev/null and b/test/webpage_samples/_task4/bd6dae/screenshot.jpg differ
diff --git a/test/webpage_samples/_task4/bd6dae/text.txt b/test/webpage_samples/_task4/bd6dae/text.txt
new file mode 100644
index 0000000..ea8b8a9
--- /dev/null
+++ b/test/webpage_samples/_task4/bd6dae/text.txt
@@ -0,0 +1,469 @@
+News
+Media
+Polls
+Portfolio
+Get PRO
+Sign In
+Develop
+Region
+Careers
+Guides
+Bizz Hub
+Submit
+Top News
+Show All
+Panic Score
+590%+225FS Bonus at BetFury: PLAY & WIN NOW🚀: 8000+ Slots, Live Casino, Sportsbook🎰 The best Vip Club & Transfer Program. Get Weekly&Monthly Bonuses. 25% Cashback. Crypto Staking: EARN up to 200%🤑
+***
+Comprehensive Sportsbook & Casino. Welcome Bonus 7 BTC + 250 Free Spins. Play without KYC 1xbitworldwide.com
+15min
+$ETH Breaking the ~0.04 level on the ETH/BTC pair would be confirmation for me that we'll get another big altcoin leg up. ETH is always the leader in a big altcoin dominance push. Historically, Q1 has been bullish for the ETH/BTC ratio. I think the market is shaping up nicely… @daancrypto
+BTC ETH ETH …
+17min
+‘Idle Mine’ Game Guide: Tips to Earn More Bitcoin on iOS and Android decrypt.co
+BTC
+18min
+What is ISO 20022 compliance for crypto coins? – Is it a ‘must have’ for crypto adoption? cryptopolitan.com
+18min
+MicroStrategy’s Bitcoin Venture Will Not End Well, Warns Martin Shkreli cryptodnes.bg
+18min
+This Project Could Could Crypto Gaming Forever.. (XBorg) Boxmining
+18min
+Daily Discussion Megathread - December 17, 2024 (GMT+0) r/cryptomarkets
+21min
+Austrian Police Uncover $1.2 Million 'Rip-Deal 2.0' Crypto Fraud decrypt.co
+26min
+‘No to CBDC, yes to Bitcoin’ — European MP calls for EU BTC reserve cointelegraph.com
+2
+2
+2
+1
+27min
+This Little-Known DOJ Rule Often Leaves Crypto Fraud Victims Empty-Handed: Bloomberg Law cryptonews.com
+BTC ETH
+1
+31min
+Bitcoin News: Riot Platforms Expands Holdings to 17,429 BTC thecoinrepublic.com
+33min
+ZachXBT explores $5.36M wallet-draining attack cryptopolitan.com
+33min
+🇪🇺 European MP: "Donald Trump is going to create a #Bitcoin Strategic Reserve. Bitcoin is skyrocketing. The EU is squandering our money!" EU MP @knafo_sarah tells the European Parliament to set up a "Strategic Bitcoin Reserve". WATCH ENGLISH TRANSLATED SPEECH (Ai) @btc_archive
+BTC
+33min
+Bybit To Stop Services in France Effective January 8, 2025 coinpedia.org
+34min
+Aave Community Considers Proposal to Exit Polygon thedefiant.io
+AAVE
+39min
+Exodus to List on the NYSE American coinjournal.net
+1
+1
+41min
+Ethereum Foundation Dump Another 100 ETH for $420k, ETH Price to Drop coinpedia.org
+ETH ETH
+1
+1
+44min
+Spot Crypto ETFs in 2025: Is Solana, Ripple, and Cardano Next? coinpedia.org
+1
+1
+1
+48min
+Binance Announces Support for Major Terra Luna Classic Upgrade cryptodnes.bg
+LUNC
+51min
+Crypto 'eating TradFi's lunch' as $5.75B Coinbase revenue beats Nasdaq cointelegraph.com
+3
+51min
+ZetaChain Launches Gateway to Simplify Universal Yield, DEX Aggregation, and More crypto-economy.com
+ZETA
+1
+1
+1
+1
+52min
+Bitcoin ETFs top gold in total assets within a year of launch cryptoslate.com
+BTC
+2
+56min
+XRP ‘off to the races’ to hit $4, according to crypto analyst finbold.com
+1
+1
+1
+1
+1
+1h
+Bitcoin Hits Record High: $107,699 – $110K Next? coinpaprika.com
+BTC
+8
+7
+8
+6
+1h
+Mammoth $2.51 Billion in Bitcoin in Past 20 Hours – What’s Going On? u.today
+BTC ATH ATH
+1h
+The two beefs that will reshape our global economy and the future of AI next year cryptopolitan.com
+1
+1h
+SSSSS snake Wif hat: Live on another exchange! Bullish ASF! r/cryptomars
+ATH ASF ATH …
+2
+1h
+Crypto.com CEO meets with US President-elect Donald Trump. What could this mean for the future of $CRO and crypto adoption in the US? r/crypto_currency_news
+CRO
+1
+1
+1
+1h
+Kraken and BitGo to Lead FTX Repayment Process Starting January 2025 cryptodnes.bg
+1
+1
+1
+1h
+Ethereum Reaches $4,100 For The First Time In Over Three Years, Aiming For $5,000 Next newsbtc.com
+1
+1
+1
+1
+1h
+Executives flood blockchain gaming firms ahead of 2025’s AAA launches cointelegraph.com
+1h
+CyberKongz Takes a Stand Against SEC’s Wells Notice altcoinbuzz.io
+1
+1
+1h
+Base - Good or meh? r/cryptomarkets
+1h
+XRPL governance under scrutiny, Ripple CTO suggests voting upgrades cryptopolitan.com
+XRP
+1
+1
+1h
+Lido Discontinues Polygon Staking Service After Community Approval crypto-economy.com
+1
+1h
+Bitcoin Price Prediction 2025: Can BTC Rally to $150K by Mid-Year? coinpedia.org
+1
+1
+1
+2h
+FTX News: Date and Source For Creditor Repayment Announced thecoinrepublic.com
+2h
+Lido Finance Announces Plans to Shut Down Operations on Polygon coinpaper.com
+1
+1
+1
+1
+2h
+MicroStrategy’s Bitcoin Bet Pays Off: Surpassed $20bn in Bitcoin profits. coinpedia.org
+1
+1
+1
+1
+2h
+Ethereum Price Prediction: Cup and Handle Signals $6K Breakout, But.. thecoinrepublic.com
+1
+1
+2h
+Curve’s Egorov makes first major $1.2M CRV buyback since June liquidation cryptopolitan.com
+CRV
+2h
+XRP’s Exchange Inflow Tops $25 Million Ahead of RLUSD Launch beincrypto.com
+2h
+Ethereum whales now hold 57% of supply – Impact on ETH? ambcrypto.com
+ETH ETH
+2h
+Bitget Expands into El Salvador with Bitcoin Service Provider License coinpaper.com
+BTC
+2h
+Japan's MicroStrategy to Issue 4.5 Billion Yen Bonds to Buy Bitcoin u.today
+BTC
+2h
+GrokAI says XRP price will hit this target by December 31, 2024 finbold.com
+2
+2h
+Google’s Willow quantum chip vs. Bitcoin security — What’s at stake? cointelegraph.com
+BTC
+2h
+Trader Says Altcoin That’s Up over 8x in Under Three Months to Outperform Market, Updates Outlook on Solana dailyhodl.com
+2h
+Argentina is officially out of recession – Here’s all Milei did cryptopolitan.com
+1
+1
+1
+2h
+Ozean Poseidon Testnet from Clearpool is LIVE! altcoinbuzz.io
+CPOOL BIG RWA
+2h
+FTX Payouts Begin January 3rd, 2025 altcoinbuzz.io
+Load more
+Home
+About
+Dismiss
+CryptoPanic is a news aggregator platform indicating impact on price and market for traders and cryptocurrency enthusiasts. Now includes Portfolio Tracker, Media Feed and Blogs.
+
+
+Show Price alerts
+Show Following feed in Top News
+Sponsored by: NordVPN
+NordVPN Christmas Campaign - Special Offer: Up to 74% off + 3 extra months, starting at $2.99 / 2.99 €
+Trending
+SHOW MORE
+51min
+Crypto 'eating TradFi's lunch' as $5.75B Coinbase revenue beats Nasdaq cointelegraph.com
+3
+1h
+Bitcoin Hits Record High: $107,699 – $110K Next? coinpaprika.com
+BTC
+8
+7
+8
+6
+3h
+Ripple XRP Is Going To $100 In 2025 Bitcoin And The Cryptocurrency Market Are ABOUT TO SKYROCKET TheModernInvestor
+BTC XRP
+2
+1
+1
+1
+1
+1
+1
+3h
+Riot Platforms Buys $69M in Bitcoin, Hits 17,429 BTC coinpaprika.com
+BTC
+7
+7
+7
+6
+4h
+FTX to Start Creditor Repayments on January 3 coinpaprika.com
+7
+7
+7
+6
+5h
+Breaking News: India’s Parliament Discusses Comprehensive Crypto Framework coinpedia.org
+4
+3
+1
+1
+5
+3
+1
+13h
+Charles Hoskinson says Cardano is ready to “take over the world” cryptopolitan.com
+ADA
+10
+10
+2
+2
+12
+8
+6
+2
+Recent Comments
+SHOW MORE
+5min
+CryptoFlugHund (Chaaarlieee !!!🙄😡) Charles Hoskinson says Cardano is ready to “take over the world”
+21min
+crypto2011 420k should make the price drop? Ethereum Foundation Dump Another 100 ETH for $420k, ETH Price to Drop
+31min
+malo7 Ça m’étonnerais GrokAI says XRP price will hit this target by December 31, 2024
+38min
+crypto2011 Nope. By end of January. Bitcoin Price Prediction 2025: Can BTC Rally to $150K by Mid-Year?
+45min
+Cassandre Also cultist propaganda is an area where they shine Cardano founder Charles Hoskinson blasts Wyoming Token Commission boss over ADA and XRP exclusion
+1h
+Cassandre It's not about you Cardano founder Charles Hoskinson blasts Wyoming Token Commission boss over ADA and XRP exclusion
+1h
+pumpkincat420 useless Shitcoin. Charles Hoskinson says Cardano is ready to “take over the world”
+1h
+Cassandre Oh but I'm invulnerable in my logical thinking :) you think I'm getting trolled but I'm countering think tank narratives in their roots... Cardano founder Charles Hoskinson blasts Wyoming Token Commission boss over ADA and XRP exclusion
+2h
+feras1 one day u will find xrp 32 $ GrokAI says XRP price will hit this target by December 31, 2024
+4h
+feras1 today xrp 2.75 Here’s How Much Ripple USD (RLUSD) Has Been Minted Ahead of Today’s Launch
+Trending Poll
+SHOW MORE
+Will bitcoin pump because Donald trump's presidential inauguration? 2w ago by 47_m.naufal
+Yes that will happen
+No,that wont happen
+Vote
+171 votes
+ 4
+Gainers & Losers (from top 50)
+Coin % 24h % 1h Price Volume 24hBitget Token
+BGB
+ 18.86% 1.38% $3.89 $250,834,731
+XRP
+XRP
+ 14.33% 2.37% $2.70 $19,544,042,267
+Stellar
+XLM
+ 13.31% 0.45% $0.464 $1,390,111,393
+Cronos
+CRO
+ 12.62% 1.82% $0.194 $171,766,985
+TRON
+TRX
+ 5.33% 1.01% $0.294 $3,174,699,996
+Hedera
+HBAR
+ 5.19% 0.75% $0.292 $954,671,912
+Hyperliquid
+HYPE
+ 4.98% -1.72% $27.46 $331,099,240
+VeChain
+VET
+ 4.90% 2.45% $0.057 $182,356,846
+Mantle
+MNT
+ 4.77% -0.84% $1.24 $149,556,620
+Aptos
+APT
+ 4.70% -0.76% $13.90 $742,590,965
+Chainlink
+LINK
+ -4.88% -0.32% $28.39 $2,802,338,782
+Aave
+AAVE
+ -3.13% -0.09% $371.59 $1,548,183,217
+Kaspa
+KAS
+ -1.68% -0.24% $0.146 $200,087,654
+MANTRA
+OM
+ -0.71% 0.37% $3.92 $118,024,518
+Artificial Superintelligence Alliance
+FET
+ -0.10% 0.53% $1.69 $470,778,103
+Bittensor
+TAO
+ -0.08% 0.22% $537.72 $259,986,324
+Tether
+USDT
+ -0.04% 0.05% $1.00 $57,925,808,904
+USDS
+USDS
+ -0.03% -0.02% $1.00 $10,823,600
+Uniswap
+UNI
+ -0.03% 0.54% $16.33 $822,036,869
+Ethena USDe
+USDE
+ -0.02% 0.02% $1.00 $101,645,983
+Advertise
+Developers
+About
+Contact
+Terms
+© CryptoPanic.com
+Region
+Become PRO
+Guides
+Bizz Hub
+Advertise
+Developers
+About
+Careers
+Contact
+Terms
+Log in
+Sign Up
+0
+1h
+24h
+7d
+$
+0.00
+%
+MC
+$
+3.93T
+2.83%
+BTC
+$
+106,766
+2.80%
+ETH
+$
+3995.9
+1.93%
+XRP
+$
+2.70
+14.33%
+USDT
+$
+1.00
+-0.04%
+SOL
+$
+222.03
+3.57%
+BNB
+$
+719.61
+1.82%
+DOGE
+$
+0.405
+2.37%
+USDC
+$
+1.000
+-0.00%
+ADA
+$
+1.10
+4.14%
+STETH
+$
+3986.8
+1.87%
+TRX
+$
+0.294
+5.33%
+AVAX
+$
+50.26
+3.21%
+LINK
+$
+28.39
+-4.88%
+WSTETH
+$
+4742.5
+1.84%
+SHIB
+$
+0.000
+1.98%
+TON
+$
+6.12
+1.50%
+WBTC
+$
+106,418
+2.83%
+XLM
+$
+0.464
+13.31%
+SUI
+$
+4.75
+1.91%
+Use search to follow more currencies
+We value your privacy
+
+By clicking Accept, you consent to the use of all cookies. If you do not wish to accept all cookies, you may choose to manage your preferences by opting out optional cookies. For more information on how we use cookies and to view our Privacy Policy and our Cookie Notice.
+
+ CryptoPanic (required): Used for site functioning properly
+ Analytics (optional): Used for CryptoPanic improvements
+Accept
\ No newline at end of file
diff --git a/test/webpage_samples/_task4/focus_point.json b/test/webpage_samples/_task4/focus_point.json
new file mode 100644
index 0000000..c903ae8
--- /dev/null
+++ b/test/webpage_samples/_task4/focus_point.json
@@ -0,0 +1,4 @@
+[{"focuspoint": "BTC现价", "explanation": "价格+对应日期时间"},
+{"focuspoint": "ETH现价", "explanation": "价格+对应日期时间"},
+{"focuspoint": "XRP现价", "explanation": "价格+对应日期时间"}
+]
diff --git a/test/webpage_samples/_task4/record-2024-12-18-19-59-38.txt b/test/webpage_samples/_task4/record-2024-12-18-19-59-38.txt
new file mode 100644
index 0000000..09ad678
--- /dev/null
+++ b/test/webpage_samples/_task4/record-2024-12-18-19-59-38.txt
@@ -0,0 +1,239 @@
+focus statement: #BTC现价
+解释:价格+对应日期时间
+#ETH现价
+解释:价格+对应日期时间
+#XRP现价
+解释:价格+对应日期时间
+
+
+raw materials: bd6dae
+
+llm model: Qwen/Qwen2.5-7B-Instruct
+hallucination times: 1
+total analysis time: 13.208484888076782
+
+author and publish time(not formated): {'source': 'NA', 'publish_date': 'NA'}
+infos(not formated):
+#BTC现价: Riot Platforms Expands Holdings to 17,429 BTC
+#ETH现价: The best Vip Club & Transfer Program. Get Weekly&Monthly Bonuses. 25% Cashback. Crypto Staking: EARN up to 200%
+#BTC现价: Bitcoin Hits Record High: $107,699 – $110K Next? coinpaprika.comBTC87861h
+#ETH现价: Ethereum Reaches $4,100 For The First Time In Over Three Years, Aiming For $5,000 Next newsbtc.com11111h
+#XRP现价: XRP ‘off to the races’ to hit $4, according to crypto analyst finbold.com111111h
+#BTC现价: Bitcoin Hits Record High: $107,699 – $110K Next? coinpaprika.com
+#ETH现价: Ethereum Price Prediction: Cup and Handle Signals $6K Breakout, But.. thecoinrepublic.com
+#XRP现价: Ripple XRP Is Going To $100 In 2025 Bitcoin And The Cryptocurrency Market Are ABOUT TO SKYROCKET TheModernInvestorBTC XRP
+#BTC现价: XRPXRP 14.33% 2.37% $2.70 $19,544,042,267
+#ETH现价: XRPXRP 14.33% 2.37% $2.70 $19,544,042,267
+#XRP现价: XRPXRP 14.33% 2.37% $2.70 $19,544,042,267
+#BTC现价: $106,7662.80%
+#ETH现价: $3995.91.93%
+#XRP现价: $2.7014.33%
+more urls:
+WBTC $106,418 2.83%
+ETH $3995.9 1.93%
+BTC $106,766 2.80%
+XRP $2.70 14.33%
+
+************
+
+llm model: THUDM/glm-4-9b-chat
+hallucination times: 1
+total analysis time: 9.734665870666504
+
+author and publish time(not formated): {'source': 'NA', 'publish_date': 'NA'}
+infos(not formated):
+BTC现价: Welcome Bonus 7 BTC + 250 Free Spins
+ETH现价: 15min$ETH Breaking the ~0.04 level on the ETH/BTC pair would be confirmation for me that we'll get another big altcoin leg up.
+BTC现价: $107,699 – $110K
+ETH现价: $4,100 For The First Time In Over Three Years, Aiming For $5,000 Next
+XRP现价: XRP ‘off to the races’ to hit $4
+BTC现价: $107,699 – $110K
+ETH现价: Cup and Handle Signals $6K Breakout
+XRP现价: Ripple XRP Is Going To $100 In 2025 Bitcoin And The Cryptocurrency Market Are ABOUT TO SKYROCKET
+XRP现价: $2.70
+BTC现价: $106,766
+ETH现价: $3,995.91
+XRP现价: $2.70
+more urls:
+WBTC $106,418 2.83%
+Mantle
+Chainlink
+MANTRA
+Hedera
+Artificial Superintelligence Alliance
+NordVPN Christmas Campaign - Special Offer: Up to 74% off + 3 extra months, starting at $2.99 / 2.99 €
+Bitget Token
+Stellar
+VeChain
+Hyperliquid
+TRON
+Bittensor
+BTC $106,766 2.80%
+XRP $2.70 14.33%
+Will bitcoin pump because Donald trump's presidential inauguration?
+Kaspa
+47_m.naufal
+Aptos
+
+************
+
+llm model: deepseek-ai/DeepSeek-V2.5
+hallucination times: 4
+total analysis time: 16.07617998123169
+
+author and publish time(not formated): {'source': 'NA', 'publish_date': 'NA'}
+infos(not formated):
+BTC现价: $106,766 2.80%
+ETH现价: $3995.9 1.93%
+XRP现价: $2.70 14.33%
+more urls:
+WBTC $106,418 2.83%
+STETH $3986.8 1.87%
+ETH $3995.9 1.93%
+BTC $106,766 2.80%
+XRP $2.70 14.33%
+BNB $719.61 1.82%
+
+************
+
+llm model: Qwen/QwQ-32B-Preview
+hallucination times: 0
+total analysis time: 55.54377293586731
+
+author and publish time(not formated): {'source': 'NA', 'publish_date': 'NA'}
+infos(not formated):
+#BTC现价: 价格+对应日期时间
+#ETH现价: 价格+对应日期时间
+#XRP现价: 价格+对应日期时间
+BTC现价: Bitcoin Hits Record High: $107,699 – $110K Next? coinpaprika.com BTC ATH ATH1h
+ETH现价: Ethereum Foundation Dump Another 100 ETH for $420k, ETH Price to Drop coinpedia.org ETH ETH1144min
+XRP现价: XRP ‘off to the races’ to hit $4, according to crypto analyst finbold.com 111111h
+#BTC现价: Bitcoin Hits Record High: $107,699 – $110K Next? coinpaprika.com
+#ETH现价: Ethereum Price Prediction: Cup and Handle Signals $6K Breakout, But.. thecoinrepublic.com
+#XRP现价: Ripple XRP Is Going To $100 In 2025 Bitcoin And The Cryptocurrency Market Are ABOUT TO SKYROCKET TheModernInvestorBTC XRP
+BTC现价: 比特币现价为$16,500,日期时间为2023年10月10日12:00
+ETH现价: 以太坊现价为$1,200,日期时间为2023年10月10日12:00
+XRP现价: 瑞波币现价为$0.30,日期时间为2023年10月10日12:00
+#BTC现价: $106,766
+#ETH现价: $3995.91
+#XRP现价: $2.70
+more urls:
+
+
+************
+
+llm model: Qwen/Qwen2.5-Coder-32B-Instruct
+hallucination times: 3
+total analysis time: 6.612479209899902
+
+author and publish time(not formated): {'source': 'NA', 'publish_date': 'NA'}
+infos(not formated):
+#BTC现价: Bitcoin Hits Record High: $107,699 – $110K Next?
+#ETH现价: Ethereum Reaches $4,100 For The First Time In Over Three Years, Aiming For $5,000 Next
+#XRP现价: XRP ‘off to the races’ to hit $4, according to crypto analyst
+#BTC现价: $106,7662.80%
+#ETH现价: $3995.91.93%
+#XRP现价: $2.7014.33%
+more urls:
+ETH $3995.9 1.93%
+BTC $106,766 2.80%
+XRP $2.70 14.33%
+
+************
+
+llm model: Qwen/Qwen2.5-32B-Instruct
+hallucination times: 4
+total analysis time: 6.956144094467163
+
+author and publish time(not formated): {'source': 'NA', 'publish_date': 'NA'}
+infos(not formated):
+BTC现价: $106,766
+ETH现价: $3995.91
+XRP现价: $2.70
+more urls:
+ETH $3995.9 1.93%
+BTC $106,766 2.80%
+XRP $2.70 14.33%
+
+************
+
+llm model: Qwen/Qwen2.5-14B-Instruct
+hallucination times: 3
+total analysis time: 6.254049062728882
+
+author and publish time(not formated): {'source': 'NA', 'publish_date': 'NA'}
+infos(not formated):
+BTC现价: Bitcoin Hits Record High: $107,699 – $110K Next?
+BTC现价: $107,699
+XRP现价: $2.70
+BTC现价: $106,766
+ETH现价: $3995.91
+XRP现价: $2.70
+more urls:
+ETH $3995.9 1.93%
+BTC $106,766 2.80%
+XRP $2.70 14.33%
+
+************
+
+llm model: Qwen/Qwen2.5-Coder-7B-Instruct
+hallucination times: 2
+total analysis time: 5.391617059707642
+
+author and publish time(not formated): {'source': 'NA', 'publish_date': 'NA'}
+infos(not formated):
+BTC现价: Bitcoin Hits Record High: $107,699 – $110K Next?
+ETH现价: Ethereum Reaches $4,100 For The First Time In Over Three Years, Aiming For $5,000 Next
+XRP现价: XRP ‘off to the races’ to hit $4, according to crypto analyst
+BTC现价: 4hferas1 today xrp 2.75
+ETH现价: 4hferas1 today xrp 2.75
+XRP现价: 4hferas1 today xrp 2.75
+BTC现价: BTC$106,766
+ETH现价: ETH$3995.91
+XRP现价: XRP$2.70
+more urls:
+WBTC $106,418 2.83%
+ETH $3995.9 1.93%
+BTC $106,766 2.80%
+XRP $2.70 14.33%
+
+************
+
+llm model: 01-ai/Yi-1.5-34B-Chat-16K
+hallucination times: 0
+total analysis time: 12.98062801361084
+
+author and publish time(not formated): {'source': 'CryptoPanic', 'publish_date': 'NA'}
+infos(not formated):
+#BTC现价: BTC现价:$BTC
+#ETH现价: ETH现价:$ETH
+#XRP现价: XRP现价:$XRP
+#BTC现价: Bitcoin Price Prediction 2025: Can BTC Rally to $150K by Mid-Year?
+#ETH现价: Ethereum Reaches $4,100 For The First Time In Over Three Years, Aiming For $5,000 Next
+#XRP现价: XRPL governance under scrutiny, Ripple CTO suggests voting upgrades
+#BTC现价: Bitcoin价格:$107,699
+#ETH现价: Ethereum价格:$6,000(预测数据)
+#XRP现价: XRP价格:$100(预测数据)
+#BTC现价: Bitcoin (BTC) Price: $3.89
+#ETH现价: Ethereum (ETH) Price: $2.70
+#XRP现价: Ripple (XRP) Price: $0.294
+#BTC现价: $106,766
+#ETH现价: $399
+#XRP现价: $2.70
+more urls:
+DOGE $0.405 2.37%
+WSTETH $4742.5 1.84%
+WBTC $106,418 2.83%
+USDC $1.000 -0.00%
+SHIB $0.000 1.98%
+BTC $106,766 2.80%
+XRP $2.70 14.33%
+TON $6.12 1.50%
+SUI $4.75 1.91%
+BNB $719.61 1.82%
+ETH $3995.9 1.93%
+STETH $3986.8 1.87%
+AVAX $50.26 3.21%
+
+************
+
diff --git a/test/webpage_samples/crawlee_storage/request_queues/default/7aypBtXvInG5cU9.json b/test/webpage_samples/crawlee_storage/request_queues/default/7aypBtXvInG5cU9.json
new file mode 100644
index 0000000..6d7ddeb
--- /dev/null
+++ b/test/webpage_samples/crawlee_storage/request_queues/default/7aypBtXvInG5cU9.json
@@ -0,0 +1,19 @@
+{
+ "url": "https://cryptopanic.com/news/",
+ "unique_key": "https://cryptopanic.com/news",
+ "method": "GET",
+ "headers": {},
+ "payload": null,
+ "user_data": {
+ "__crawlee": {
+ "state": 3
+ }
+ },
+ "retry_count": 0,
+ "no_retry": false,
+ "loaded_url": "https://cryptopanic.com/",
+ "handled_at": "2024-12-17 12:18:29.655660+00:00",
+ "id": "7aypBtXvInG5cU9",
+ "json_": "{\n \"url\": \"https://cryptopanic.com/news/\",\n \"unique_key\": \"https://cryptopanic.com/news\",\n \"method\": \"GET\",\n \"headers\": {},\n \"payload\": null,\n \"user_data\": {\n \"__crawlee\": {\n \"state\": 3\n }\n },\n \"retry_count\": 0,\n \"no_retry\": false,\n \"loaded_url\": \"https://cryptopanic.com/\",\n \"handled_at\": \"2024-12-17 12:18:29.655660+00:00\",\n \"id\": \"7aypBtXvInG5cU9\",\n \"order_no\": null\n}",
+ "order_no": null
+}
\ No newline at end of file
diff --git a/test/webpage_samples/crawlee_storage/request_queues/default/__metadata__.json b/test/webpage_samples/crawlee_storage/request_queues/default/__metadata__.json
new file mode 100644
index 0000000..7b21ce1
--- /dev/null
+++ b/test/webpage_samples/crawlee_storage/request_queues/default/__metadata__.json
@@ -0,0 +1,14 @@
+{
+ "id": "default",
+ "name": null,
+ "accessed_at": "2024-12-17 12:18:29.657027+00:00",
+ "created_at": "2024-12-17 12:17:52.625612+00:00",
+ "modified_at": "2024-12-17 12:18:29.655992+00:00",
+ "had_multiple_clients": false,
+ "handled_request_count": 1,
+ "pending_request_count": 0,
+ "stats": {},
+ "total_request_count": 1,
+ "user_id": "1",
+ "resource_directory": "test/webpage_samples/crawlee_storage/request_queues/default"
+}
\ No newline at end of file
diff --git a/test/webpage_samples/task0/3d274c/link_dict.json b/test/webpage_samples/task0/3d274c/link_dict.json
new file mode 100644
index 0000000..9e26dfe
--- /dev/null
+++ b/test/webpage_samples/task0/3d274c/link_dict.json
@@ -0,0 +1 @@
+{}
\ No newline at end of file
diff --git a/test/webpage_samples/task0/3d274c/screenshot.jpg b/test/webpage_samples/task0/3d274c/screenshot.jpg
new file mode 100644
index 0000000..f32b7bc
Binary files /dev/null and b/test/webpage_samples/task0/3d274c/screenshot.jpg differ
diff --git a/test/webpage_samples/task0/3d274c/text.txt b/test/webpage_samples/task0/3d274c/text.txt
new file mode 100644
index 0000000..3758315
--- /dev/null
+++ b/test/webpage_samples/task0/3d274c/text.txt
@@ -0,0 +1,7 @@
+天冷脂肪多更保暖?真相来了!
+学习强国 2024年12月17日 17:30 北京
+都说冬天瘦子羡慕胖胖的人,因为觉得不怕冷,毕竟比别人多了一层“肉盾”抵御严寒。脂肪多就等于抗冻吗?戳视频赶快了解下。
+
+来源:中国天气网
+责编:孙雪萌
+审校:郭圣群 张恒
\ No newline at end of file
diff --git a/test/webpage_samples/task0/ab9447/link_dict.json b/test/webpage_samples/task0/ab9447/link_dict.json
new file mode 100644
index 0000000..da28ff8
--- /dev/null
+++ b/test/webpage_samples/task0/ab9447/link_dict.json
@@ -0,0 +1,96 @@
+{
+ "首页": "https://www.gd121.cn/index.shtml",
+ "预警": "https://www.gd121.cn/yj/index.shtml",
+ "广州": "https://www.gd121.cn/yj/index.shtml?city=广州",
+ "深圳": "https://www.gd121.cn/yj/index.shtml?city=深圳",
+ "佛山": "https://www.gd121.cn/yj/index.shtml?city=佛山",
+ "东莞": "https://www.gd121.cn/yj/index.shtml?city=东莞",
+ "中山": "https://www.gd121.cn/yj/index.shtml?city=中山",
+ "珠海": "https://www.gd121.cn/yj/index.shtml?city=珠海",
+ "惠州": "https://www.gd121.cn/yj/index.shtml?city=惠州",
+ "江门": "https://www.gd121.cn/yj/index.shtml?city=江门",
+ "肇庆": "https://www.gd121.cn/yj/index.shtml?city=肇庆",
+ "汕头": "https://www.gd121.cn/yj/index.shtml?city=汕头",
+ "潮州": "https://www.gd121.cn/yj/index.shtml?city=潮州",
+ "揭阳": "https://www.gd121.cn/yj/index.shtml?city=揭阳",
+ "汕尾": "https://www.gd121.cn/yj/index.shtml?city=汕尾",
+ "湛江": "https://www.gd121.cn/yj/index.shtml?city=湛江",
+ "茂名": "https://www.gd121.cn/yj/index.shtml?city=茂名",
+ "阳江": "https://www.gd121.cn/yj/index.shtml?city=阳江",
+ "云浮": "https://www.gd121.cn/yj/index.shtml?city=云浮",
+ "韶关": "https://www.gd121.cn/yj/index.shtml?city=韶关",
+ "清远": "https://www.gd121.cn/yj/index.shtml?city=清远",
+ "梅州": "https://www.gd121.cn/yj/index.shtml?city=梅州",
+ "河源": "https://www.gd121.cn/yj/index.shtml?city=河源",
+ "天气": "https://www.gd121.cn/tq/ld/list.shtml",
+ "云图": "https://www.gd121.cn/tq/yt/list.shtml",
+ "海洋": "https://www.gd121.cn/tq/hy/list.shtml",
+ "台风": "https://www.gd121.cn/tq/tf/list.shtml",
+ "旅游天气": "https://www.gd121.cn/tq/jdtq_list.shtml",
+ "机场&车站": "https://www.gd121.cn/tq/jccz/list.shtml",
+ "高清图集": "https://www.gd121.cn/tq/gqtj/index.shtml",
+ "视频": "https://www.gd121.cn/tq/tqsp/list.shtml",
+ "服务": "https://www.gd121.cn/fw/index.shtml",
+ "科普": "https://www.gd121.cn/kp/index.shtml",
+ "互动": "https://www.gd121.cn/hd/index.shtml",
+ "用户反馈": "https://www.gd121.cn/hd/yhfk/list.shtml",
+ "实景上传": "https://www.gd121.cn/hd/sjsc/index.shtml",
+ "用户中心": "http://passport.gd121.cn/ucy_center/index",
+ "共享": "https://www.gd121.cn/cos/index.shtml",
+ "气象资讯": "https://www.gd121.cn/zx/qxzx/list.shtml",
+ "冷空气持续补充,广东晴燥天气持续": "https://www.gd121.cn/zx/qxzx/ff8080818a06a6560193d2f022fb3bbb.shtml",
+ "广东维持干燥 早晚寒冷": "https://www.gd121.cn/zx/qxzx/ff8080818a06a6560193cdc5262a3ba4.shtml",
+ "冻感十足的广东,未来几天部分地区最低气温跌破零度": "https://www.gd121.cn/zx/qxzx/ff8080818a06a6560193c88781563b7c.shtml",
+ "冷空气持续补充影响,我省维持干燥天气早晚寒冷": "https://www.gd121.cn/zx/qxzx/ff8080818a06a6560193c33926013b52.shtml",
+ "冷空气持续补充 广东今明气温继续下降": "https://www.gd121.cn/zx/qxzx/ff8080818a06a6560193bec2d8183b24.shtml",
+ "冷空气持续补充影响,广东气温逐日小幅下降": "https://www.gd121.cn/zx/qxzx/ff8080818a06a6560193b8ee572f3af6.shtml",
+ "冷空气今日到达广东 未来几天气温逐日下降": "https://www.gd121.cn/zx/qxzx/ff8080818a06a6560193b473fce73adb.shtml",
+ "前方冷空气们在排队了,这次“冻”真格!": "https://www.gd121.cn/zx/qxzx/ff8080818a06a6560193aef0633d3ab4.shtml",
+ "新一股冷空气11日起影响广东": "https://www.gd121.cn/zx/qxzx/ff8080818a06a6560193aa2d54233aa0.shtml",
+ "7-9日广东大部晴到多云早晚寒凉": "https://www.gd121.cn/zx/qxzx/ff8080818a06a65601939f2fccbc3a6b.shtml",
+ "周末广东气温继续下降": "https://www.gd121.cn/zx/qxzx/ff8080818a06a65601939a607a933a59.shtml",
+ "7-8日中等强度冷空气影响广东": "https://www.gd121.cn/zx/qxzx/ff8080818a06a65601939596d4903a41.shtml",
+ "本周末中等强度冷空气入粤": "https://www.gd121.cn/zx/qxzx/ff8080818a06a65601938fc87eee3a2a.shtml",
+ "未来两天天气平稳,4-6日两股冷空气到访": "https://www.gd121.cn/zx/qxzx/ff8080818a06a65601938af540583a14.shtml",
+ "广东云量增多气温上升": "https://www.gd121.cn/zx/qxzx/ff8080818a06a65601938584f2273a00.shtml",
+ "未来三天广东天气干燥,早晚寒冷": "https://www.gd121.cn/zx/qxzx/ff8080818a06a656019380b4f77d39e6.shtml",
+ "未来几天广东天晴干燥,注意补水": "https://www.gd121.cn/zx/qxzx/ff8080818a06a65601937b4ea6d539d0.shtml",
+ "未来三天广东天晴干燥 气温缓升": "https://www.gd121.cn/zx/qxzx/ff8080818a06a6560193769fe4f2399d.shtml",
+ "未来几天广东昼暖夜冷,注意保暖": "https://www.gd121.cn/zx/qxzx/ff8080818a06a656019370da773c398b.shtml",
+ "未来三天广东晴冷继续": "https://www.gd121.cn/zx/qxzx/ff8080818a06a65601936ba4bb3d396b.shtml",
+ "下一页": "https://www.gd121.cn/list_2.shtml",
+ "尾页": "https://www.gd121.cn/list_10.shtml",
+ "更多>>": "https://www.gd121.cn/kp/yjkp/list.shtml",
+ "[详情]": "https://www.gd121.cn/zx/yjxy/8a14d310645ec72401645edada382a17.shtml",
+ "广东省气象局启动气象灾害(暴雨)Ⅳ级...": "https://www.gd121.cn/zx/yjxy/8a14d310645ec72401645edadbb42a19.shtml",
+ "广东省气象局结束气象灾害(暴雨)Ⅱ级...": "https://www.gd121.cn/zx/yjxy/8a14d310645ec72401645edadd2e2a1b.shtml",
+ "广东省气象局结束气象灾害(台风)Ⅲ级...": "https://www.gd121.cn/zx/yjxy/8a14d310645ec72401645edade922a1d.shtml",
+ "广东省气象局启动气象灾害(暴雨)Ⅱ级...": "https://www.gd121.cn/zx/yjxy/8a14d310645ec72401645edadfff2a1f.shtml",
+ "广东省气象局升级气象灾害(台风)应急...": "https://www.gd121.cn/zx/yjxy/8a14d310645ec72401645edae2d42a23.shtml",
+ "广东省气象局启动气象灾害(台风)Ⅳ级...": "https://www.gd121.cn/zx/yjxy/8a14d310645ec72401645edae16f2a21.shtml",
+ "广东省气象局结束气象灾害(寒冷)Ⅲ级...": "https://www.gd121.cn/zx/yjxy/8a14d310645ec72401645edae4362a25.shtml",
+ "7-8日广东大部仍有强降水": "https://www.gd121.cn/zx/zhxx/ff8080818a06a656018a6dbc39560290.shtml",
+ "7号台风“查帕卡&rdq...": "https://www.gd121.cn/zx/zhxx/ff8080817a75a9a2017abcdfd97f01bd.shtml",
+ "18-20日广东多云有雾 21-24...": "https://www.gd121.cn/zx/zhxx/ff808081706d374701718b8ba69306c3.shtml",
+ "12-15日广东大部天晴 早晚寒凉": "https://www.gd121.cn/zx/zhxx/ff808081706d374701716c94668c062a.shtml",
+ "11日广东将有一次强对流天气过程": "https://www.gd121.cn/zx/zhxx/ff808081706d374701715cf0535405d5.shtml",
+ "三天内广东大部降水频繁 粤北山区需防...": "https://www.gd121.cn/zx/zhxx/ff808081706d37470171438addf4052e.shtml",
+ "自然灾害": "https://www.gd121.cn/kp/yjkp/yjcs/zrzhsjcs/list.shtml",
+ "都市中遇到洪水怎么办": "https://www.gd121.cn/kp/yjkp/yjcs/zrzhsjcs/8a14d310645ec72401645ec9bdb20626.shtml",
+ "公共卫生": "https://www.gd121.cn/kp/yjkp/yjcs/ggwssjcs/list.shtml",
+ "中国疾控中心提示:春节期间应做好传染病防御": "https://www.gd121.cn/kp/yjkp/yjcs/ggwssjcs/8a14d310645ec72401645ec9c64f065c.shtml",
+ "社会安全": "https://www.gd121.cn/kp/yjkp/yjcs/shaqsjcs/list.shtml",
+ "购买、使用消防产品不容马虎": "https://www.gd121.cn/kp/yjkp/yjcs/shaqsjcs/8a14d310645ec72401645ec9c994066e.shtml",
+ "预警信号": "https://www.gd121.cn/kp/yjkp/yjxh/list.shtml",
+ "森林火险预警信号": "https://www.gd121.cn/kp/yjkp/yjxh/8a14d310645ec72401645ec9c9f70670.shtml",
+ "天气插件": "https://www.gd121.cn/share/pluginWea.do",
+ "数据接口": "https://www.gd121.cn/share/interface.do?id=1",
+ "停课铃APP": "https://www.gd121.cn/fw/yjkhd/8a14d310645ec72401645ecbea730edb.shtml",
+ "缤纷微天气": "https://www.gd121.cn/fw/wx/ff8080816f16da59016f176859fa0019.shtml",
+ "政策法规": "https://www.gd121.cn/kp/zcfg/list.shtml",
+ "数据共享": "https://www.gd121.cn/share/",
+ "广东省气象局网站": "http://gd.cma.gov.cn/",
+ "粤港澳大湾区天气网站": "https://www.gbaweather.net/tc/",
+ "粤ICP备05011356号": "http://beian.miit.gov.cn",
+ "粤公网安备 44010402001842号": "http://www.beian.gov.cn/portal/registerSystemInfo?recordcode=44010402001842"
+}
\ No newline at end of file
diff --git a/test/webpage_samples/task0/ab9447/screenshot.jpg b/test/webpage_samples/task0/ab9447/screenshot.jpg
new file mode 100644
index 0000000..c03aab4
Binary files /dev/null and b/test/webpage_samples/task0/ab9447/screenshot.jpg differ
diff --git a/test/webpage_samples/task0/ab9447/text.txt b/test/webpage_samples/task0/ab9447/text.txt
new file mode 100644
index 0000000..b8f0766
--- /dev/null
+++ b/test/webpage_samples/task0/ab9447/text.txt
@@ -0,0 +1,107 @@
+今天是2024年12月17日
+登录/注册
+
+首页
+预警
+天气
+服务
+科普
+互动
+共享
+资讯
+>气象资讯
+冷空气持续补充,广东晴燥天气持续
+2024-12-17 12:46:13
+广东维持干燥 早晚寒冷
+2024-12-16 12:41:10
+冻感十足的广东,未来几天部分地区最低气温跌破零度
+2024-12-15 12:15:44
+冷空气持续补充影响,我省维持干燥天气早晚寒冷
+2024-12-14 11:55:15
+冷空气持续补充 广东今明气温继续下降
+2024-12-13 14:44:21
+冷空气持续补充影响,广东气温逐日小幅下降
+2024-12-12 11:34:08
+冷空气今日到达广东 未来几天气温逐日下降
+2024-12-11 14:42:01
+前方冷空气们在排队了,这次“冻”真格!
+2024-12-10 13:00:10
+新一股冷空气11日起影响广东
+2024-12-09 14:48:38
+7-9日广东大部晴到多云早晚寒凉
+2024-12-07 11:35:30
+周末广东气温继续下降
+2024-12-06 13:10:35
+7-8日中等强度冷空气影响广东
+2024-12-05 14:51:50
+本周末中等强度冷空气入粤
+2024-12-04 11:48:22
+未来两天天气平稳,4-6日两股冷空气到访
+2024-12-03 13:19:09
+广东云量增多气温上升
+2024-12-02 11:58:23
+未来三天广东天气干燥,早晚寒冷
+2024-12-01 13:32:44
+未来几天广东天晴干燥,注意补水
+2024-11-30 12:22:53
+未来三天广东天晴干燥 气温缓升
+2024-11-29 14:33:31
+未来几天广东昼暖夜冷,注意保暖
+2024-11-28 11:39:46
+未来三天广东晴冷继续
+2024-11-27 11:22:58
+共200条 下一页 尾页 每页20条,第1/10页 转到第页 跳转
+应急响应
+更多>>
+广东省气象局结束气象灾害(暴雨...
+
+6月12日到14日,珠江三角洲市县、粤西大部分市县出现了暴雨到大暴雨局部特大暴雨。预计,15日...[详情]
+
+广东省气象局启动气象灾害(暴雨)Ⅳ级...
+广东省气象局结束气象灾害(暴雨)Ⅱ级...
+广东省气象局结束气象灾害(台风)Ⅲ级...
+广东省气象局启动气象灾害(暴雨)Ⅱ级...
+广东省气象局升级气象灾害(台风)应急...
+广东省气象局启动气象灾害(台风)Ⅳ级...
+广东省气象局结束气象灾害(寒冷)Ⅲ级...
+热点专题
+更多>>
+1
+2
+综合消息
+更多>>
+7-8日广东大部仍有强降水
+7号台风“查帕卡&rdq...
+18-20日广东多云有雾 21-24...
+12-15日广东大部天晴 早晚寒凉
+11日广东将有一次强对流天气过程
+三天内广东大部降水频繁 粤北山区需防...
+应急科普
+更多>>
+
+自然灾害
+都市中遇到洪水怎么办
+
+公共卫生
+中国疾控中心提示:春节期间应做好传染病防御
+
+社会安全
+购买、使用消防产品不容马虎
+
+预警信号
+森林火险预警信号
+天气插件
+形式多样,强大的自定义功能,为您的网站量身定做个性化预警插件。
+数据接口
+我们会为您们提供最权威、最真实、最及时、最全面的数据服务与共享。
+停课铃APP
+广东省气象局官方客户端,提供全省停课信号、天气预警、天气查询等服务。
+缤纷微天气
+微信小程序,提供基于位置的天气预报、预警服务。
+预警信息 | 公众服务 | 应急科普 | 政策法规 | 数据共享 | 服务渠道
+
+友情链接:广东省气象局网站 | 粤港澳大湾区天气网站
+
+联系电话:020-87664716地址:广东省广州市天河区东莞庄路312号
+
+ 粤ICP备05011356号 粤公网安备 44010402001842号 ©广东省气象公共服务中心版权所有 | 技术支持:数鹏通(LinkCM)科技
\ No newline at end of file
diff --git a/test/webpage_samples/task0/focus_point.json b/test/webpage_samples/task0/focus_point.json
new file mode 100644
index 0000000..e5da69e
--- /dev/null
+++ b/test/webpage_samples/task0/focus_point.json
@@ -0,0 +1,3 @@
+[{"focuspoint": "广州市的冷空气预警信息", "explanation": "仅限2024年12月及以后"},
+{"focuspoint": "深圳市的冷空气预警信息", "explanation": "仅限2024年12月及以后"},
+{"focuspoint": "广东全省的台风预警", "explanation": "仅限2024年的信息"}]
\ No newline at end of file
diff --git a/test/webpage_samples/task0/record-2024-12-17-23-16-07.txt b/test/webpage_samples/task0/record-2024-12-17-23-16-07.txt
new file mode 100644
index 0000000..2e454ed
--- /dev/null
+++ b/test/webpage_samples/task0/record-2024-12-17-23-16-07.txt
@@ -0,0 +1,1171 @@
+focus statement: #广州市的冷空气预警信息
+解释:仅限2024年12月及以后
+#深圳市的冷空气预警信息
+解释:仅限2024年12月及以后
+#广东全省的台风预警
+解释:仅限2024年的信息
+
+
+raw materials: ab9447
+
+llm model: Qwen/Qwen2-VL-72B-Instruct
+hallucination times: 2
+total analysis time: 150.04202795028687
+author and publish time(not formated): {'source': 'NA', 'publish_date': 'NA'}
+infos(not formated): []
+more urls:
+冷空气持续补充,广东晴燥天气持续
+冷空气持续补充影响,我省维持干燥天气早晚寒冷
+冷空气持续补充影响,广东气温逐日小幅下降
+冷空气今日到达广东 未来几天气温逐日下降
+广东省气象局启动气象灾害(暴雨)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)Ⅳ级应急响应
+广东省气象局启动气象灾害(台风)
+
+Cost:0.0799
+------------
+
+llm model: OpenGVLab/InternVL2-26B
+hallucination times: 1
+total analysis time: 185.21710896492004
+author and publish time(not formated): {'source': '广东气象', 'publish_date': '2024-12-17'}
+infos(not formated): [{'focus': '广州市的冷空气预警信息', 'content': '冷空气持续补充,广东晴朗天气持续\n广东省气象台发布寒冷黄色预警\n冷空气持续补充影响,我省维持干燥天气早晚寒冷\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充影响,广东省气温逐日小幅下降\n冷空气持续补充'}]
+more urls:
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(暴雨)IV级应急响应
+广东省气象局启动气象灾害(台风)IV级应急响应
+广东省气象局启动气象灾害(
+
+Cost:0.0248
+
+------------
+
+llm model: TeleAI/TeleMM
+hallucination times: 3
+total analysis time: 8.113977193832397
+author and publish time(not formated): {}
+infos(not formated): []
+more urls: set()
+
+cost:0
+
+------------
+
+llm model: Pro/Qwen/Qwen2-VL-7B-Instruct
+hallucination times: 1
+total analysis time: 57.21018600463867
+author and publish time(not formated): {'source': 'NA', 'publish_date': '2024-12-17'}
+infos(not formated): [{'focus': '广州市的冷空气预警信息', 'content': '广东省气象局结束气象灾害(暴雨)IV级...'}, {'focus': '深圳市的冷空气预警信息', 'content': '广东省气象局结束气象灾害(暴雨)II级...'}, {'focus': '广东全省的台风预警', 'content': '广东省气象局结束气象灾害(台风)III级...'}]
+more urls:
+广东省气象局结束气象灾害(暴雨...)
+广东省气象局结束气象灾害(台风...)
+广东省气象局结束气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象灾害(暴雨...)
+广东省气象局启动气象灾害(寒冷...)
+广东省气象局启动气象灾害(台风...)
+广东省气象局启动气象
+
+Cost:0.0068
+
+------------
+
+llm model: Pro/OpenGVLab/InternVL2-8B
+hallucination times: 1
+total analysis time: 14.625344038009644
+author and publish time(not formated): {'source': '广东气象', 'publish_date': '2024-12-17'}
+infos(not formated): [{'focus': '广州市的冷空气预警信息', 'content': '冷空气持续补充,广东晴燥天气持续,未来几天部分地区最低气温跌破零度,冷空气持续补充影响,我省维持干燥天气早晚寒冷,冷空气持续补充广东明天气温继续下降,冷空气持续补充影响,广东气温逐日小幅下降,冷空气今日到达广东未来几天气温逐日下降,前方冷空气们排队了,这次“冻”真格!新一股冷空气11日起影响广东,7-9日广东大部分地区到多云早晚寒凉,周末广东气温继续下降,7-8日中等强度冷空气影响广东,本周中强度冷空气入粤,未来两天天气平稳,4-6日两股冷空气到访,广东云量增多气温上升,未来三天广东天气晴朗早晚寒冷,未来几天广东天气干燥,注意补水,未来三天广东天气干燥气温缓升,未来几天广东早晚夜冷,注意保暖,未来三天广东晴冷继续'}]
+more urls:
+应急响应
+广东省气象局结束气象灾害(暴雨)
+热点专题
+全国防灾减灾日
+综合消息
+未来三天广东天气晴朗,早晚寒冷
+应急科普
+自然灾害
+公共卫生
+社会安全
+天气插件
+数据接口
+停课铃APP
+缤纷微天气
+预警信息 | 公众服务 | 应急科普 | 政策法规 | 数据共享 | 服务渠道
+联系电话:020-87674616
+地址:广东省广州市天河区东苑路312号
+粤ICP备05011356号
+粤公网安备 440104020001842号
+技术支持:数鹏通(LinkCM)科技
+
+cost:0.0060
+
+------------
+
+llm model: OpenGVLab/InternVL2-Llama3-76B
+hallucination times: 0
+total analysis time: 39.64336585998535
+author and publish time(not formated): {'source': '广东气象', 'publish_date': '2024-12-17'}
+infos(not formated): [{'focus': '广州市的冷空气预警信息', 'content': '冷空气持续补充,广东明天气温继续下降。冷空气持续补充影响,广东明天气温继续下降。冷空气今日到达广东,未来几天气温逐日下降。前方冷空气在排队了,这次‘冻’真格!新一股冷空气11日起影响广东。7-9日广东大部晴到多云早晚寒冷。周末广东气温继续下降。7-8日中等强度冷空气影响广东。本周末中等强度冷空气入粤。未来两天天气平稳,4-6日两股冷空气到访。广东云量增多气温上升。未来三天广东大部分晴,早晚寒冷。未来几天广东东部干燥,注意补水。未来三天广东东部干燥气温缓升。未来几天广东昼夜温差,注意保暖。未来三天广东晴冷继续。'}]
+more urls:
+广东省气象局结束气象灾害(暴雨、暴雨)
+广东省气象局启动气象灾害(暴雨)Ⅳ级...
+广东省气象局结束气象灾害(台风)Ⅲ级...
+广东省气象局启动气象灾害(台风)Ⅱ级...
+广东省气象局升级气象灾害(台风)应急...
+广东省气象局启动气象灾害(台风)Ⅳ级...
+广东省气象局结束气象灾害(寒冷)Ⅱ级...
+全国防灾减灾日
+7-8日广东大部仍有强降水
+7号台风“查帕”&8号台风...
+18-20日广东多云有零星21-24...
+12-15日广东大部天晴早晚寒凉
+11日广东将有一次强对流天气过程
+三天内广东大部降水频繁粤北山区需防...
+自然灾害
+都市中遇到洪水怎么办
+公共卫生
+中国疾控中心提示:春节期间应做好传染病防御
+社会安全
+购买、使用消防产品不容马虎
+预警信息
+森林火险预警信息号
+天气插件
+形式多样,强大的自定义功能,为您的网站量身定做个性化预警插件。
+数据接口
+我们会为您提供最权威、最真实、最及时、最全面的数据服务与共享。
+停课铃APP
+广东省气象局官方客户端,提供全省停课预警、天气预警、天气查询等服务。
+缤纷微天气
+微信小程序,提供基于位置的天气预报、预警服务。
+
+cost:0.0725
+
+
+************
+
+raw materials: 3d274c
+
+llm model: Qwen/Qwen2-VL-72B-Instruct
+hallucination times: 2
+total analysis time: 7.546638011932373
+author and publish time(not formated): {'source': '学习强国', 'publish_date': '2024年12月17日'}
+infos(not formated): []
+more urls:
+天冷脂肪多更保暖?真相来了
+
+------------
+
+llm model: OpenGVLab/InternVL2-26B
+hallucination times: 5
+total analysis time: 7.500505208969116
+author and publish time(not formated): {'source': '中国天气网', 'publish_date': '2024-12-17'}
+infos(not formated): []
+more urls:
+天冷脂肪多更保暖?真相来了!
+来源:中国天气网
+责编:孙雪萌
+审核:郭圣群 张恒
+
+------------
+
+llm model: TeleAI/TeleMM
+hallucination times: 3
+total analysis time: 3.687187910079956
+author and publish time(not formated): {}
+infos(not formated): []
+more urls: set()
+
+------------
+
+llm model: Pro/Qwen/Qwen2-VL-7B-Instruct
+hallucination times: 2
+total analysis time: 5.731669902801514
+author and publish time(not formated): {'source': '中国天气网', 'publish_date': '2024年12月17日'}
+infos(not formated): []
+more urls:
+天冷脂肪多更保暖?真相来了!
+
+------------
+
+llm model: Pro/OpenGVLab/InternVL2-8B
+hallucination times: 7
+total analysis time: 4.302519083023071
+author and publish time(not formated): {'source': '中国天气网', 'publish_date': '2024年12月17日'}
+infos(not formated): []
+more urls:
+都说冬天瘦子羡慕胖胖的人,因为觉得不怕冷,毕竟比别人多了一层“肉香”抵御严寒。脂肪多就等于抗冻吗?戳视频赶快了解下。
+来源:中国天气网
+责编:孙雪萌
+审校:郭圣群 张恒
+
+------------
+
+llm model: OpenGVLab/InternVL2-Llama3-76B
+hallucination times: 3
+total analysis time: 12.28525710105896
+author and publish time(not formated): {'source': '中国天气网', 'publish_date': '2024-12-17'}
+infos(not formated): []
+more urls:
+天冷脂肪多更保暖?真相来了!
+都说冬天瘦子羡慕胖胖的人,因为觉得不怕冷,毕竟比别人多了一层“肉香”抵御严寒。脂肪多就等于抗冻吗?戳视频赶快了解下。
+
+------------
+
diff --git a/test/webpage_samples/task0/record-2024-12-18-12-33-28.txt b/test/webpage_samples/task0/record-2024-12-18-12-33-28.txt
new file mode 100644
index 0000000..b802743
--- /dev/null
+++ b/test/webpage_samples/task0/record-2024-12-18-12-33-28.txt
@@ -0,0 +1,384 @@
+focus statement: #广州市的冷空气预警信息
+解释:仅限2024年12月及以后
+#深圳市的冷空气预警信息
+解释:仅限2024年12月及以后
+#广东全省的台风预警
+解释:仅限2024年的信息
+
+
+raw materials: ab9447
+
+llm model: Qwen/Qwen2.5-7B-Instruct
+hallucination times: 0
+total analysis time: 28.350039958953857
+
+author and publish time(not formated): {'source': 'NA', 'publish_date': '2024-12-17'}
+infos(not formated):
+#广州市的冷空气预警信息: 冷空气持续补充,广东晴燥天气持续2024-12-17 12:46:13广东维持干燥 早晚寒冷2024-12-16 12:41:10冻感十足的广东,未来几天部分地区最低气温跌破零度2024-12-15 12:15:44冷空气持续补充影响,我省维持干燥天气早晚寒冷2024-12-14 11:55:15冷空气持续补充 广东今明气温继续下降2024-12-13 14:44:21冷空气持续补充 广东气温逐日小幅下降2024-12-12 11:34:08冷空气今日到达广东 未来几天气温逐日下降2024-12-11 14:42:01前方冷空气们在排队了,这次“冻”真格!2024-12-10 13:00:10新一股冷空气11日起影响广东2024-12-09 14:48:387-9日广东大部晴到多云早晚寒凉2024-12-07 11:35:30周末广东气温继续下降2024-12-06 13:10:357-8日中等强度冷空气影响广东2024-12-05 14:51:50本周末中等强度冷空气入粤2024-12-04 11:48:22未来两天天气平稳,4-6日两股冷空气到访2024-12-03 13:19:09广东云量增多气温上升2024-12-02 11:58:23未来三天广东天气干燥,早晚寒冷2024-12-01 13:32:44未来几天广东天晴干燥,注意补水2024-11-30 12:22:53未来三天广东天晴干燥 气温缓升2024-11-29 14:33:31未来几天广东昼暖夜冷,注意保暖2024-11-28 11:39:46未来三天广东晴冷继续2024-11-27 11:22:58
+more urls:
+台风
+冷空气持续补充,广东晴燥天气持续
+广东维持干燥 早晚寒冷
+冻感十足的广东,未来几天部分地区最低气温跌破零度
+冷空气持续补充影响,我省维持干燥天气早晚寒冷
+冷空气持续补充 广东今明气温继续下降
+冷空气持续补充影响,广东气温逐日小幅下降
+冷空气今日到达广东 未来几天气温逐日下降
+新一股冷空气11日起影响广东
+7-9日广东大部晴到多云早晚寒凉
+周末广东气温继续下降
+7-8日中等强度冷空气影响广东
+本周末中等强度冷空气入粤
+未来两天天气平稳,4-6日两股冷空气到访
+广东省气象局结束气象灾害(暴雨)Ⅱ级...
+广东省气象局结束气象灾害(台风)Ⅲ级...
+7号台风“查帕卡&rdq...
+预警信号
+广东省气象局网站
+
+************
+
+llm model: THUDM/glm-4-9b-chat
+hallucination times: 1
+total analysis time: 38.19417214393616
+
+author and publish time(not formated): {'source': 'NA', 'publish_date': '2024-12-17'}
+infos(not formated):
+广州市的冷空气预警信息: 广东维持干燥 早晚寒冷2024-12-16 12:41:10冻感十足的广东,未来几天部分地区最低气温跌破零度2024-12-15 12:15:44冷空气持续补充影响,我省维持干燥天气早晚寒冷2024-12-14 11:55:15冷空气持续补充 广东今明气温继续下降2024-12-13 14:44:21冷空气持续补充影响,广东气温逐日小幅下降2024-12-12 11:34:08冷空气今日到达广东 未来几天气温逐日下降2024-12-11 14:42:01前方冷空气们在排队了,这次“冻”真格!2024-12-10 13:00:10新一股冷空气11日起影响广东2024-12-09 14:48:387-9日广东大部晴到多云早晚寒凉2024-12-07 11:35:30周末广东气温继续下降2024-12-06 13:10:357-8日中等强度冷空气影响广东2024-12-05 14:51:50本周末中等强度冷空气入粤2024-12-04 11:48:22未来两天天气平稳,4-6日两股冷空气到访2024-12-03 13:19:09广东云量增多气温上升2024-12-02 11:58:23未来三天广东天气干燥,早晚寒冷2024-12-01 13:32:44未来几天广东天晴干燥,注意补水2024-11-30 12:22:53未来三天广东天晴干燥 气温缓升2024-11-29 14:33:31未来几天广东昼暖夜冷,注意保暖2024-11-28 11:39:46未来三天广东晴冷继续2024-11-27 11:22:58共200条 下一页 尾页 每页20条,第1/10页 转到第页 跳转
+深圳市的冷空气预警信息: 广东维持干燥 早晚寒冷2024-12-16 12:41:10冻感十足的广东,未来几天部分地区最低气温跌破零度2024-12-15 12:15:44冷空气持续补充影响,我省维持干燥天气早晚寒冷2024-12-14 11:55:15冷空气持续补充 广东今明气温继续下降2024-12-13 14:44:21冷空气持续补充影响,广东气温逐日小幅下降2024-12-12 11:34:08冷空气今日到达广东 未来几天气温逐日下降2024-12-11 14:42:01前方冷空气们在排队了,这次“冻”真格!2024-12-10 13:00:10新一股冷空气11日起影响广东2024-12-09 14:48:387-9日广东大部晴到多云早晚寒凉2024-12-07 11:35:30周末广东气温继续下降2024-12-06 13:10:357-8日中等强度冷空气影响广东2024-12-05 14:51:50本周末中等强度冷空气入粤2024-12-04 11:48:22未来两天天气平稳,4-6日两股冷空气到访2024-12-03 13:19:09广东云量增多气温上升2024-12-02 11:58:23未来三天广东天气干燥,早晚寒冷2024-12-01 13:32:44未来几天广东天晴干燥,注意补水2024-11-30 12:22:53未来三天广东天晴干燥 气温缓升2024-11-29 14:33:31未来几天广东昼暖夜冷,注意保暖2024-11-28 11:39:46未来三天广东晴冷继续2024-11-27 11:22:58共200条 下一页 尾页 每页20条,第1/10页 转到第页 跳转
+more urls:
+预警
+天气
+台风
+冷空气持续补充,广东晴燥天气持续
+广东维持干燥 早晚寒冷
+冻感十足的广东,未来几天部分地区最低气温跌破零度
+冷空气持续补充影响,我省维持干燥天气早晚寒冷
+冷空气持续补充 广东今明气温继续下降
+冷空气持续补充影响,广东气温逐日小幅下降
+冷空气今日到达广东 未来几天气温逐日下降
+前方冷空气们在排队了,这次“冻”真格!
+新一股冷空气11日起影响广东
+周末广东气温继续下降
+7-8日中等强度冷空气影响广东
+本周末中等强度冷空气入粤
+未来两天天气平稳,4-6日两股冷空气到访
+未来三天广东天气干燥,早晚寒冷
+未来三天广东天晴干燥 气温缓升
+未来几天广东昼暖夜冷,注意保暖
+未来三天广东晴冷继续
+广东省气象局结束气象灾害(台风)Ⅲ级...
+广东省气象局升级气象灾害(台风)应急...
+广东省气象局启动气象灾害(台风)Ⅳ级...
+7-8日广东大部仍有强降水
+7号台风“查帕卡&rdq...
+18-20日广东多云有雾 21-24...
+12-15日广东大部天晴 早晚寒凉
+三天内广东大部降水频繁 粤北山区需防...
+自然灾害
+公共卫生
+社会安全
+预警信号
+森林火险预警信号
+广东省气象局网站
+粤港澳大湾区天气网站
+
+-6
+************
+
+llm model: deepseek-ai/DeepSeek-V2.5
+hallucination times: 1
+total analysis time: 1055.8521568775177
+
+author and publish time(not formated): {'source': '广东省气象公共服务中心', 'publish_date': '2024-12-17'}
+infos(not formated):
+广州市的冷空气预警信息: 冷空气持续补充,广东晴燥天气持续2024-12-17 12:46:13
+广州市的冷空气预警信息: 广东维持干燥 早晚寒冷2024-12-16 12:41:10
+广州市的冷空气预警信息: 冻感十足的广东,未来几天部分地区最低气温跌破零度2024-12-15 12:15:44
+广州市的冷空气预警信息: 冷空气持续补充影响,我省维持干燥天气早晚寒冷2024-12-14 11:55:15
+广州市的冷空气预警信息: 冷空气持续补充 广东今明气温继续下降2024-12-13 14:44:21
+广州市的冷空气预警信息: 冷空气持续补充影响,广东气温逐日小幅下降2024-12-12 11:34:08
+广州市的冷空气预警信息: 冷空气今日到达广东 未来几天气温逐日下降2024-12-11 14:42:01
+广州市的冷空气预警信息: 新一股冷空气11日起影响广东2024-12-09 14:48:38
+广州市的冷空气预警信息: 7-8日中等强度冷空气影响广东2024-12-05 14:51:50
+广州市的冷空气预警信息: 本周末中等强度冷空气入粤2024-12-04 11:48:22
+广州市的冷空气预警信息: 未来两天天气平稳,4-6日两股冷空气到访2024-12-03 13:19:09
+广州市的冷空气预警信息: 未来三天广东天气干燥,早晚寒冷2024-12-01 13:32:44
+广州市的冷空气预警信息: 未来几天广东天晴干燥,注意补水2024-11-30 12:22:53
+广州市的冷空气预警信息: 未来三天广东天晴干燥 气温缓升2024-11-29 14:33:31
+广州市的冷空气预警信息: 未来几天广东昼暖夜冷,注意保暖2024-11-28 11:39:46
+广州市的冷空气预警信息: 未来三天广东晴冷继续2024-11-27 11:22:58
+深圳市的冷空气预警信息: 冷空气持续补充,广东晴燥天气持续2024-12-17 12:46:13
+深圳市的冷空气预警信息: 广东维持干燥 早晚寒冷2024-12-16 12:41:10
+深圳市的冷空气预警信息: 冻感十足的广东,未来几天部分地区最低气温跌破零度2024-12-15 12:15:44
+深圳市的冷空气预警信息: 冷空气持续补充影响,我省维持干燥天气早晚寒冷2024-12-14 11:55:15
+深圳市的冷空气预警信息: 冷空气持续补充 广东今明气温继续下降2024-12-13 14:44:21
+深圳市的冷空气预警信息: 冷空气持续补充影响,广东气温逐日小幅下降2024-12-12 11:34:08
+深圳市的冷空气预警信息: 冷空气今日到达广东 未来几天气温逐日下降2024-12-11 14:42:01
+深圳市的冷空气预警信息: 新一股冷空气11日起影响广东2024-12-09 14:48:38
+深圳市的冷空气预警信息: 7-8日中等强度冷空气影响广东2024-12-05 14:51:50
+深圳市的冷空气预警信息: 本周末中等强度冷空气入粤2024-12-04 11:48:22
+深圳市的冷空气预警信息: 未来两天天气平稳,4-6日两股冷空气到访2024-12-03 13:19:09
+深圳市的冷空气预警信息: 未来三天广东天气干燥,早晚寒冷2024-12-01 13:32:44
+深圳市的冷空气预警信息: 未来几天广东天晴干燥,注意补水2024-11-30 12:22:53
+深圳市的冷空气预警信息: 未来三天广东天晴干燥 气温缓升2024-11-29 14:33:31
+深圳市的冷空气预警信息: 未来几天广东昼暖夜冷,注意保暖2024-11-28 11:39:46
+深圳市的冷空气预警信息: 未来三天广东晴冷继续2024-11-27 11:22:58
+广东全省的台风预警: 广东省气象局结束气象灾害(台风)Ⅲ级...广东省气象局启动气象灾害(台风)Ⅳ级...广东省气象局升级气象灾害(台风)应急...广东省气象局启动气象灾害(台风)Ⅳ级...
+more urls:
+台风
+气象资讯
+冷空气持续补充,广东晴燥天气持续
+广东维持干燥 早晚寒冷
+冻感十足的广东,未来几天部分地区最低气温跌破零度
+冷空气持续补充影响,我省维持干燥天气早晚寒冷
+广东省气象局结束气象灾害(台风)Ⅲ级...
+广东省气象局升级气象灾害(台风)应急...
+广东省气象局启动气象灾害(台风)Ⅳ级...
+广东省气象局结束气象灾害(寒冷)Ⅲ级...
+7号台风“查帕卡&rdq...
+预警信号
+广东省气象局网站
+粤港澳大湾区天气网站
+
+************
+
+llm model: Qwen/QwQ-32B-Preview
+hallucination times: 2
+total analysis time: 917.1603031158447
+
+author and publish time(not formated): {'source': 'NA', 'publish_date': '2024-12-17'}
+infos(not formated):
+广东全省的台风预警: 应急响应更多>>广东省气象局结束气象灾害(暴雨...6月12日到14日,珠江三角洲市县、粤西大部分市县出现了暴雨到大暴雨局部特大暴雨。预计,15日...[详情]广东省气象局启动气象灾害(暴雨)Ⅳ级...广东省气象局结束气象灾害(暴雨)Ⅱ级...广东省气象局结束气象灾害(台风)Ⅲ级...广东省气象局启动气象灾害(暴雨)Ⅱ级...广东省气象局升级气象灾害(台风)应急...广东省气象局启动气象灾害(台风)Ⅳ级...广东省气象局结束气象灾害(寒冷)Ⅲ级...热点专题更多>>12综合消息更多>>7-8日广东大部仍有强降水7号台风“查帕卡&rdq...18-20日广东多云有雾 21-24...12-15日广东大部天晴 早晚寒凉11日广东将有一次强对流天气过程三天内广东大部降水频繁 粤北山区需防...应急科普更多>> 自然灾害都市中遇到洪水怎么办 公共卫生中国疾控中心提示:春节期间应做好传染病防御 社会安全购买、使用消防产品不容马虎 预警信号森林火险预警信号天气插件形式多样,强大的自定义功能,为您的网站量身定做个性化预警插件。数据接口我们会为您们提供最权威、最真实、最及时、最全面的数据服务与共享。停课铃APP广东省气象局官方客户端,提供全省停课信号、天气预警、天气查询等服务。缤纷微天气微信小程序,提供基于位置的天气预报、预警服务。预警信息 | 公众服务 | 应急科普 | 政策法规 | 数据共享 | 服务渠道友情链接:广东省气象局网站 | 粤港澳大湾区天气网站联系电话:020-87664716地址:广东省广州市天河区东莞庄路312号 粤ICP备05011356号 粤公网安备 44010402001842号 ©广东省气象公共服务中心版权所有 | 技术支持:数鹏通(LinkCM)科技
+more urls:
+天气
+台风
+服务
+预警信号
+
+************
+
+llm model: Qwen/Qwen2.5-Coder-32B-Instruct
+hallucination times: 0
+total analysis time: 128.1328718662262
+
+author and publish time(not formated): {'source': 'NA', 'publish_date': '2024-12-17'}
+infos(not formated):
+广州市的冷空气预警信息: 冷空气持续补充,广东晴燥天气持续2024-12-17 12:46:13广东维持干燥 早晚寒冷2024-12-16 12:41:10冻感十足的广东,未来几天部分地区最低气温跌破零度2024-12-15 12:15:44冷空气持续补充影响,我省维持干燥天气早晚寒冷2024-12-14 11:55:15冷空气持续补充 广东今明气温继续下降2024-12-13 14:44:21冷空气持续补充影响,广东气温逐日小幅下降2024-12-12 11:34:08冷空气今日到达广东 未来几天气温逐日下降2024-12-11 14:42:01前方冷空气们在排队了,这次“冻”真格!2024-12-10 13:00:10新一股冷空气11日起影响广东2024-12-09 14:48:387-9日广东大部晴到多云早晚寒凉2024-12-07 11:35:30周末广东气温继续下降2024-12-06 13:10:357-8日中等强度冷空气影响广东2024-12-05 14:51:50本周末中等强度冷空气入粤2024-12-04 11:48:22未来两天天气平稳,4-6日两股冷空气到访2024-12-02 11:58:23未来三天广东天气干燥,早晚寒冷2024-12-01 13:32:44未来几天广东天晴干燥,注意补水2024-11-30 12:22:53未来三天广东天晴干燥 气温缓升2024-11-29 14:33:31未来几天广东昼暖夜冷,注意保暖2024-11-28 11:39:46未来三天广东晴冷继续2024-11-27 11:22:58
+深圳市的冷空气预警信息: 冷空气持续补充,广东晴燥天气持续2024-12-17 12:46:13广东维持干燥 早晚寒冷2024-12-16 12:41:10冻感十足的广东,未来几天部分地区最低气温跌破零度2024-12-15 12:15:44冷空气持续补充影响,我省维持干燥天气早晚寒冷2024-12-14 11:55:15冷空气持续补充 广东今明气温继续下降2024-12-13 14:44:21冷空气持续补充影响,广东气温逐日小幅下降2024-12-12 11:34:08冷空气今日到达广东 未来几天气温逐日下降2024-12-11 14:42:01前方冷空气们在排队了,这次“冻”真格!2024-12-10 13:00:10新一股冷空气11日起影响广东2024-12-09 14:48:387-9日广东大部晴到多云早晚寒凉2024-12-07 11:35:30周末广东气温继续下降2024-12-06 13:10:357-8日中等强度冷空气影响广东2024-12-05 14:51:50本周末中等强度冷空气入粤2024-12-04 11:48:22未来两天天气平稳,4-6日两股冷空气到访2024-12-02 11:58:23未来三天广东天气干燥,早晚寒冷2024-12-01 13:32:44未来几天广东天晴干燥,注意补水2024-11-30 12:22:53未来三天广东天晴干燥 气温缓升2024-11-29 14:33:31未来几天广东昼暖夜冷,注意保暖2024-11-28 11:39:46未来三天广东晴冷继续2024-11-27 11:22:58
+more urls:
+台风
+[详情]
+广东省气象局启动气象灾害(暴雨)Ⅳ级...
+预警信号
+广东省气象局网站
+
+************
+
+llm model: Qwen/Qwen2.5-32B-Instruct
+hallucination times: 0
+total analysis time: 86.74333310127258
+
+author and publish time(not formated): {'source': 'NA', 'publish_date': '2024-12-17'}
+infos(not formated):
+广州市的冷空气预警信息: 冷空气持续补充影响,我省维持干燥天气早晚寒冷2024-12-14 11:55:15
+广州市的冷空气预警信息: 冷空气持续补充 广东今明气温继续下降2024-12-13 14:44:21
+广州市的冷空气预警信息: 冷空气持续补充影响,广东气温逐日小幅下降2024-12-12 11:34:08
+广州市的冷空气预警信息: 冷空气今日到达广东 未来几天气温逐日下降2024-12-11 14:42:01
+广州市的冷空气预警信息: 前方冷空气们在排队了,这次“冻”真格!2024-12-10 13:00:10
+广州市的冷空气预警信息: 新一股冷空气11日起影响广东2024-12-09 14:48:38
+深圳市的冷空气预警信息: 冷空气持续补充影响,我省维持干燥天气早晚寒冷2024-12-14 11:55:15
+深圳市的冷空气预警信息: 冷空气持续补充 广东今明气温继续下降2024-12-13 14:44:21
+深圳市的冷空气预警信息: 冷空气持续补充影响,广东气温逐日小幅下降2024-12-12 11:34:08
+深圳市的冷空气预警信息: 冷空气今日到达广东 未来几天气温逐日下降2024-12-11 14:42:01
+深圳市的冷空气预警信息: 前方冷空气们在排队了,这次“冻”真格!2024-12-10 13:00:10
+深圳市的冷空气预警信息: 新一股冷空气11日起影响广东2024-12-09 14:48:38
+more urls:
+预警
+天气
+台风
+自然灾害
+预警信号
+广东省气象局网站
+粤港澳大湾区天气网站
+
+-3
+************
+
+llm model: Qwen/Qwen2.5-14B-Instruct
+hallucination times: 1
+total analysis time: 34.1413631439209
+
+author and publish time(not formated): {'source': 'NA', 'publish_date': '2024-12-17'}
+infos(not formated):
+
+more urls:
+天气
+台风
+预警信号
+广东省气象局网站
+粤港澳大湾区天气网站
+
+-2
+************
+
+llm model: Qwen/Qwen2.5-Coder-7B-Instruct
+hallucination times: 0
+total analysis time: 51.563368797302246
+
+author and publish time(not formated): {'source': 'NA', 'publish_date': '2024-12-17'}
+infos(not formated):
+广州市的冷空气预警信息: 冷空气持续补充,广东晴燥天气持续。冻感十足的广东,未来几天部分地区最低气温跌破零度。冷空气持续补充影响,我省维持干燥天气早晚寒冷。冷空气持续补充 广东今明气温继续下降。冷空气持续补充影响,广东气温逐日小幅下降。冷空气今日到达广东 未来几天气温逐日下降。前方冷空气们在排队了,这次“冻”真格!新一股冷空气11日起影响广东。7-9日广东大部晴到多云早晚寒凉。周末广东气温继续下降。7-8日中等强度冷空气影响广东。本周末中等强度冷空气入粤。未来两天天气平稳,4-6日两股冷空气到访。广东云量增多气温上升。未来三天广东天气干燥,早晚寒冷。未来几天广东天晴干燥,注意补水。未来几天广东天晴干燥 气温缓升。未来几天广东昼暖夜冷,注意保暖。未来三天广东晴冷继续。
+more urls:
+台风
+冷空气持续补充,广东晴燥天气持续
+广东维持干燥 早晚寒冷
+冻感十足的广东,未来几天部分地区最低气温跌破零度
+冷空气持续补充影响,我省维持干燥天气早晚寒冷
+7-8日中等强度冷空气影响广东
+本周末中等强度冷空气入粤
+未来两天天气平稳,4-6日两股冷空气到访
+7号台风“查帕卡&rdq...
+12-15日广东大部天晴 早晚寒凉
+广东省气象局网站
+粤港澳大湾区天气网站
+
+-2
+************
+
+llm model: 01-ai/Yi-1.5-34B-Chat-16K
+hallucination times: 7
+total analysis time: 1233.0201609134674
+
+author and publish time(not formated): {}
+infos(not formated):
+#广东全省的台风预警: 广东省气象局结束气象灾害(台风)Ⅲ级应急响应
+more urls:
+台风
+冻感十足的广东,未来几天部分地区最低气温跌破零度
+冷空气持续补充影响,我省维持干燥天气早晚寒冷
+冷空气持续补充影响,广东气温逐日小幅下降
+新一股冷空气11日起影响广东
+未来两天天气平稳,4-6日两股冷空气到访
+12-15日广东大部天晴 早晚寒凉
+11日广东将有一次强对流天气过程
+广东省气象局网站
+粤港澳大湾区天气网站
+
+-3
+************
+
+raw materials: 3d274c
+
+llm model: Qwen/Qwen2.5-7B-Instruct
+hallucination times: 1
+total analysis time: 0.9184250831604004
+
+author and publish time(not formated): {'source': '中国天气网', 'publish_date': '2024-12-17'}
+infos(not formated):
+
+more urls:
+
+0
+************
+
+llm model: THUDM/glm-4-9b-chat
+hallucination times: 1
+total analysis time: 0.8186428546905518
+
+author and publish time(not formated): {'source': '中国天气网', 'publish_date': '2024-12-17'}
+infos(not formated):
+
+more urls:
+
+0
+************
+
+llm model: deepseek-ai/DeepSeek-V2.5
+hallucination times: 1
+total analysis time: 3.9070470333099365
+
+author and publish time(not formated): {'source': '中国天气网', 'publish_date': '2024年12月17日'}
+infos(not formated):
+
+more urls:
+
+0
+************
+
+llm model: Qwen/QwQ-32B-Preview
+hallucination times: 0
+total analysis time: 9.19908094406128
+
+author and publish time(not formated): {'source': '学习强国', 'publish_date': '2024-12-17'}
+infos(not formated):
+广州市的冷空气预警信息: 2024年12月17日 17:30 北京
+深圳市的冷空气预警信息: 2024年12月17日 17:30 北京
+广东全省的台风预警: 2024年12月17日 17:30 北京
+more urls:
+
+-3
+************
+
+llm model: Qwen/Qwen2.5-Coder-32B-Instruct
+hallucination times: 1
+total analysis time: 0.7160420417785645
+
+author and publish time(not formated): {'source': '中国天气网', 'publish_date': '2024年12月17日'}
+infos(not formated):
+
+more urls:
+
+0
+************
+
+llm model: Qwen/Qwen2.5-32B-Instruct
+hallucination times: 1
+total analysis time: 0.7163081169128418
+
+author and publish time(not formated): {'source': '中国天气网', 'publish_date': '2024-12-17'}
+infos(not formated):
+
+more urls:
+
+0
+************
+
+llm model: Qwen/Qwen2.5-14B-Instruct
+hallucination times: 1
+total analysis time: 0.7161481380462646
+
+author and publish time(not formated): {'source': '学习强国', 'publish_date': '2024-12-17'}
+infos(not formated):
+
+more urls:
+
+0
+************
+
+llm model: Qwen/Qwen2.5-Coder-7B-Instruct
+hallucination times: 1
+total analysis time: 0.5040872097015381
+
+author and publish time(not formated): {'source': '中国天气网', 'publish_date': '2024年12月17日'}
+infos(not formated):
+
+more urls:
+
+0
+************
+
+llm model: 01-ai/Yi-1.5-34B-Chat-16K
+hallucination times: 0
+total analysis time: 1.7319023609161377
+
+author and publish time(not formated): {'source': '学习强国', 'publish_date': '2024-12-17'}
+infos(not formated):
+#广州市的冷空气预警信息: 无相关信息
+#深圳市的冷空气预警信息: 无相关信息
+#广东全省的台风预警: 无相关信息
+more urls:
+
+-3
+************
+
diff --git a/test/webpage_samples/task1/5f2bcb/link_dict.json b/test/webpage_samples/task1/5f2bcb/link_dict.json
new file mode 100644
index 0000000..9e26dfe
--- /dev/null
+++ b/test/webpage_samples/task1/5f2bcb/link_dict.json
@@ -0,0 +1 @@
+{}
\ No newline at end of file
diff --git a/test/webpage_samples/task1/5f2bcb/screenshot.jpg b/test/webpage_samples/task1/5f2bcb/screenshot.jpg
new file mode 100644
index 0000000..4a6af4d
Binary files /dev/null and b/test/webpage_samples/task1/5f2bcb/screenshot.jpg differ
diff --git a/test/webpage_samples/task1/5f2bcb/text.txt b/test/webpage_samples/task1/5f2bcb/text.txt
new file mode 100644
index 0000000..28933e6
--- /dev/null
+++ b/test/webpage_samples/task1/5f2bcb/text.txt
@@ -0,0 +1,22 @@
+1
+7
+【平安北站】坚决打击群租违法现象 持续净化社区居住环境
+
+2024年,北站街道牵头相关部门在社区群众大力支持配合下,对居民社区和类住宅内的群租出租屋开展了贯穿全年的联合执法行动,清退了大量存在安全隐患的群租出租屋。全年共开展集中整治92次,对290户违法群租出租屋进行整治清退,对部分回潮的出租屋予以持续打击,全年整治总数达376户次(含反复整治)‼️
+
+同时,执法部门处罚一批违法经营群租出租屋的业主、二房东,督促上述主体合法出租房屋。
+
+街道将继续牵头各部门形成合力,紧盯群租现象易发的社区和楼栋,加强日常巡查排查,和社区居民一起及时发现群租线索。同时,持续保持高压打击力度,对群租现象露头就打,群租回潮标红处置,重点打击反复回潮、屡整不改的顽固群租现象,维护北站社区宜居宜商的和谐环境。
+
+欢迎社区群众向所在居委会、物业反馈身边的群租线索。📢💬☎️
+
+
+供稿:丁凌霄
+审稿:宋杰
+终审:桑祯骁
+
+,
+2024年12月17日 16:51
+,
+,
+上海
\ No newline at end of file
diff --git a/test/webpage_samples/task1/7cfff6/link_dict.json b/test/webpage_samples/task1/7cfff6/link_dict.json
new file mode 100644
index 0000000..9e26dfe
--- /dev/null
+++ b/test/webpage_samples/task1/7cfff6/link_dict.json
@@ -0,0 +1 @@
+{}
\ No newline at end of file
diff --git a/test/webpage_samples/task1/7cfff6/screenshot.jpg b/test/webpage_samples/task1/7cfff6/screenshot.jpg
new file mode 100644
index 0000000..7fe4ea7
Binary files /dev/null and b/test/webpage_samples/task1/7cfff6/screenshot.jpg differ
diff --git a/test/webpage_samples/task1/7cfff6/text.txt b/test/webpage_samples/task1/7cfff6/text.txt
new file mode 100644
index 0000000..5b6fcc2
--- /dev/null
+++ b/test/webpage_samples/task1/7cfff6/text.txt
@@ -0,0 +1,5 @@
+一图读懂——黄浦“零距离”学院、讲堂“四库五课”资源库
+黄浦党建 黄浦党建
+ 2024年12月17日 17:58 上海
+
+
diff --git a/test/webpage_samples/task1/8c1617/link_dict.json b/test/webpage_samples/task1/8c1617/link_dict.json
new file mode 100644
index 0000000..8c02e16
--- /dev/null
+++ b/test/webpage_samples/task1/8c1617/link_dict.json
@@ -0,0 +1,52 @@
+{
+ "思 想": "https://www.xuexi.cn/xxqg.html?id=e55ff0028ab0406e948cb0be9a8cae28",
+ "二十大时间": "https://www.xuexi.cn/xxqg.html?id=a2543113741d4a2285f86f88f0afd87f",
+ "习近平文汇": "https://www.xuexi.cn/5c90534c80d14c060d6683fa960e3676/82573c005c024095037d2186a02244cb.html",
+ "学习理论": "https://www.xuexi.cn/xxqg.html?id=3cba33e067d64ded8a1a503f0774675c",
+ "红色中国": "https://www.xuexi.cn/482f31e90c481f2161a19ecfcbb91f8b/e6109f421e472b4399b006ba21bc2ecd.html",
+ "学习科学": "https://www.xuexi.cn/896bddc5f57a423b857a85eb40f98945/72742e3e40c96ade71e42b6e7ed42419.html",
+ "国 际": "https://www.xuexi.cn/261c9a142ef8e6375ed554815a26d585/f2d8ff735982530b7a8c9bb90fa99f68.html",
+ "五个一工程": "https://www.xuexi.cn/6dd69137d25db5673406cf8d1480548e/28d3e5cb24036a88cad7550485262507.html",
+ "学习电视台": "https://www.xuexi.cn/0809b8b6ab8a81a4f55ce9cbefa16eff/ae60b027cb83715fd0eeb7bb2527e88b.html",
+ "学习电台": "https://www.xuexi.cn/xxqg.html?id=e433dab0149a4d42bb914b7a296ea7ff",
+ "强军兴军": "https://www.xuexi.cn/a9d25ec4ca996c6100d2982d33a1d8b2/4f02a12dd5663651422f5c55e10ef19e.html",
+ "学习文化": "https://www.xuexi.cn/b069a45c80585e78b558c64306bfdf92/53194398355c363c5c635c74a70c7b45.html",
+ "人民网": "http://www.people.com.cn/",
+ "新华网": "http://www.xinhuanet.com/",
+ "中国网": "http://www.china.com.cn/",
+ "央视网": "http://www.cctv.com/",
+ "国际在线": "http://www.cri.cn/",
+ "中国日报网": "http://cn.chinadaily.com.cn/",
+ "中国青年网": "http://www.youth.cn/",
+ "中国经济网": "http://www.ce.cn/",
+ "中国新闻网": "http://www.chinanews.com/",
+ "光明网": "http://www.gmw.cn/",
+ "央广网": "http://www.cnr.cn/",
+ "中工网": "http://www.workercn.cn/",
+ "党建网": "http://www.dangjian.cn/",
+ "中青在线": "http://www.cyol.com/",
+ "中国军网": "http://www.81.cn/",
+ "法治网": "http://www.legaldaily.com.cn/",
+ "求是网": "http://www.qstheory.cn/",
+ "中国网信网": "http://www.cac.gov.cn/",
+ "中国文明网": "http://www.wenming.cn/",
+ "中国政府网": "http://www.gov.cn/",
+ "教育部网站": "http://www.moe.gov.cn/",
+ "国防部网站": "http://www.mod.gov.cn/",
+ "文化和旅游部网站": "http://www.mct.gov.cn/",
+ "国新办网站": "http://www.scio.gov.cn/index.htm",
+ "中国扫黄打非网": "http://www.shdf.gov.cn/",
+ "女性之声": "http://www.womenvoice.cn",
+ "中国报业": "http://www.cnpiw.cn/index.html",
+ "中央网信办举报中心": "http://www.12377.cn/",
+ "千龙网": "http://www.qianlong.com/",
+ "中国社会科学网": "http://www.cssn.cn/",
+ "中国科技网": "http://www.stdaily.com/",
+ "中国农业新闻网": "http://www.farmer.com.cn/",
+ "西影网": "https://www.1958xy.com/",
+ "中国法律服务网": "http://www.12348.gov.cn/",
+ "中国普法网": "http://www.legalinfo.gov.cn/",
+ "中国西藏网": "http://www.tibet.cn/",
+ "中国妇女网": "http://www.cnwomen.com.cn/",
+ "京ICP备18000311号-1": "http://beian.miit.gov.cn/"
+}
\ No newline at end of file
diff --git a/test/webpage_samples/task1/8c1617/screenshot.jpg b/test/webpage_samples/task1/8c1617/screenshot.jpg
new file mode 100644
index 0000000..7ed75a3
Binary files /dev/null and b/test/webpage_samples/task1/8c1617/screenshot.jpg differ
diff --git a/test/webpage_samples/task1/8c1617/text.txt b/test/webpage_samples/task1/8c1617/text.txt
new file mode 100644
index 0000000..4242b8d
--- /dev/null
+++ b/test/webpage_samples/task1/8c1617/text.txt
@@ -0,0 +1,629 @@
+思 想
+二十大时间
+习近平文汇
+学习理论
+红色中国
+学习科学
+国 际
+五个一工程
+学习电视台
+学习电台
+强军兴军
+学习文化
+中共中央举行纪念乔石同志诞辰100周年座谈会 习近平发表重要讲话
+习近平在讲话中指出,在中国革命、建设、改革的伟大进程中,涌现出一代又一代优秀中国共产党人,乔石同志就是其中一位杰出代表讲话全文更多头条
+1234
+中共中央举行纪念乔石同志诞辰100周年座谈会 习近平发表重要讲话
+打开
+《求是》杂志发表习近平总书记重要文章
+习近平:深入推进党的自我革命
+习近平将赴澳门出席庆祝澳门回归祖国25周年大会暨澳门特别行政区第六届政府就职典礼并视察澳门特别行政区
+习近平听取李家超述职报告
+中央经济工作会议在北京举行 习近平发表重要讲话
+习近平接受外国新任驻华大使递交国书
+习近平会见俄罗斯统一俄罗斯党主席梅德韦杰夫
+习近平向“2024从都国际论坛”致贺信
+国内
+国外
+学习宣传贯彻党的二十大精神
+奋进强国路 阔步新征程
+加快发展新质生产力
+重要新闻
+打开
+李强主持国务院第十一次专题学习
+李希:高质量做好纪检监察宣传工作
+王毅谈2024年中国外交五大亮点
+石泰峰向党外人士通报中央经济工作会议精神
+中央财办解读2024年中央经济工作会议精神
+多部门开列2025年任务清单 更多增量政策将出
+2024中国正能量网络精品征集展播活动启动
+最高法发布人民法院依法审理非法捕捞水产品典型案例
+外交部:坚决反对美台军事联系和美对台出售武器
+多部门部署加大对重点企业的内贸险保障力度
+2024年国家先进制造业集群名单公布
+前11个月全国一般公共预算收入199010亿元
+商务部等发文实施零售业创新提升工程
+文旅部公布12条全国冰雪旅游精品线路
+新版目录将职业病调整为12大类135种
+三部门:做好新年春节期间拥军优属拥政爱民工作
+学习时评
+打开
+深刻把握明年经济工作的总体要求和政策取向
+“四条红线”为中美关系构筑发展基座
+和音:中国有信心推动经济持续向好
+新华时评:供需齐发力 畅通经济大循环
+工厂变智慧 中国智造有活力
+推动新旧动能平稳接续转换——论贯彻落实中央经济工作会议精神
+有力有效扩大内需——论贯彻落实中央经济工作会议精神
+以高质量发展实绩推动经济稳健前行
+综合新闻
+打开
+倾听,莲花盛开的声音——澳门社会文化发展纪事
+2024,喜看“三农”新图景:农业更高效 乡村更美好
+聚焦前11个月中国经济运行情况:延续回升态势 全年目标有望顺利实现
+神舟十九号航天员乘组将于近日择机实施第一次出舱活动
+电动汽车供电设备将实施强制性产品认证管理
+今年我国航司旅客运输量创历史新高
+2024年我国能源自给率保持在80%以上
+韩国宪法法院要求尹锡悦12月23日前提交弹劾案答辩
+中宣部发布
+打开
+关于第九届全国道德模范候选人的公示
+中央宣传部授予单杏花同志“时代楷模”称号
+中央宣传部举办第1期乡镇(街道)党委宣传委员示范培训班
+中共中央宣传部公布第十七届精神文明建设“五个一工程”获奖名单
+中宣部发出关于认真组织学习《习近平文化思想学习纲要》的通知
+“文化中国行”主题宣传创新实践研讨会在京召开
+2024年全国“宪法宣传周”活动将于12月1日启动
+中宣部电影局:发掘电影创作与社会发展之间的积极联系
+经济
+打开
+聚焦专项债、政府投资基金,国务院作出新部署
+政策组合效应继续释放 主要经济指标明显回升
+七部门发文实施零售业创新提升工程
+财政部党组召开会议传达学习中央经济工作会议精神
+货币政策开启“适度宽松”周期 适时降息降准可期
+工业生产平稳向好 制造业支撑作用不断增强
+我国加快以标准提升引领原材料工业优化升级
+协同推进降碳减污扩绿增长 不断提升经济发展“含绿量”
+水资源税改革助推绿色转型
+统筹推进财税体制改革
+筑牢科技金融强支撑
+县级融媒
+打开
+陕西吴堡:撑起老年人“幸福伞” 让养老变“享老”
+安徽长丰:城市“更新” 生活“焕新”
+天津蓟州区:理乡村之旧俗 扬文明之新风
+江西广昌:“莲心议事”切实解决群众身边“关键小事”
+浙江台州:三门健跳 鲜到先得
+汪贤挺:我给小鲵当“爸爸”
+江西上饶:婺源茶惊艳亮相茶博会引关注
+安徽巢湖:以党建“穿针”服务“引线” 助力城市基层治理提质增效
+河南灵宝:“黄河熔金”奇观带火黄土塬旅游
+吉林通化县:四举措推动移风易俗 绘就文明乡风新“底色”
+青海尖扎:全力做好冬季供暖保障工作
+新闻发布厅
+打开
+国家发展改革委、商务部、金融监管总局相关负责同志就《关于发挥国内贸易信用保险作用 助力提高内外贸一体化水平的意见》答记者问
+2024年12月16日外交部发言人林剑主持例行记者会
+商务部新闻发言人就美提高对华部分产品的301关税答记者问
+当前经济形势怎么看?大力提振消费后续会有哪些具体举措?中央财办最新回应
+国新办举行新闻发布会 介绍2024年11月份国民经济运行情况
+国家广播电视总局新闻发言人就电视剧制作单位审批管理有关问题答记者问
+人力资源社会保障部人力资源流动管理司负责人就《关于加强人力资源服务助力制造业高质量发展的意见》答记者问
+自然资源部法规司负责人解读《自然资源行政复议行政应诉规定》
+2024年12月13日外交部发言人毛宁主持例行记者会
+整治“换钱党” 公安机关捣毁地下钱庄100余个
+生态环境部气候司相关负责人就《煤层气(煤矿瓦斯)排放标准》答记者问
+强国征文
+打开
+12345678910111213
+“我和我的家乡”主题征文
+实播平台
+打开
+12345
+国新办举行新闻发布会 介绍促进房地产市场平稳健康发展有关情况
+身边的感动
+打开
+123456
+村支书郭勇:乌蒙山麓“种花人”
+全国学习平台展播
+打开
+新疆学习平台
+新疆兵团学习平台
+中央企业学习平台
+中国科学院学习平台
+北京学习平台
+天津学习平台
+河北学习平台
+山西学习平台
+内蒙古学习平台
+辽宁学习平台
+吉林学习平台
+黑龙江学习平台
+上海学习平台
+江苏学习平台
+浙江学习平台
+安徽学习平台
+福建学习平台
+江西学习平台
+山东学习平台
+河南学习平台
+湖北学习平台
+湖南学习平台
+广东学习平台
+广西学习平台
+海南学习平台
+重庆学习平台
+四川学习平台
+贵州学习平台
+云南学习平台
+西藏学习平台
+陕西学习平台
+甘肃学习平台
+青海学习平台
+宁夏学习平台
+新疆学习平台
+新疆兵团学习平台
+中央企业学习平台
+中国科学院学习平台
+北京学习平台
+天津学习平台
+河北学习平台
+山西学习平台
+内蒙古学习平台
+辽宁学习平台
+吉林学习平台
+黑龙江学习平台
+上海学习平台
+江苏学习平台
+浙江学习平台
+安徽学习平台
+福建学习平台
+江西学习平台
+山东学习平台
+河南学习平台
+湖北学习平台
+湖南学习平台
+广东学习平台
+广西学习平台
+海南学习平台
+重庆学习平台
+四川学习平台
+贵州学习平台
+云南学习平台
+西藏学习平台
+陕西学习平台
+甘肃学习平台
+青海学习平台
+宁夏学习平台
+新疆学习平台
+新疆兵团学习平台
+中央企业学习平台
+中国科学院学习平台
+打开
+001 论坚持和发展中国特色社会主义
+002 论中国梦
+003 论马克思
+004 论坚定理想信念
+005 论中国精神
+006 论“五位一体”和“四个全面”
+007 论“四个自信”
+008 论全面建成小康社会
+009 论全面深化改革
+010 论全面依法治国
+011 论全面从严治党
+012 论经济建设
+013 论新发展理念
+014 论经济新常态与供给侧结构性改革
+015 论“三农”工作和乡村振兴战略
+016 论海洋强国
+新闻联播
+党报党刊大阅读
+电台电视台大联播
+网站大浏览
+打开
+中共中央举行纪念乔石同志诞辰100周年座谈会 习近平发表重要讲话
+打开
+第一频道
+理论频道
+党史频道
+教育频道
+学习慕课
+人物频道
+文艺频道
+科技频道
+自然频道
+影视频道
+法治频道
+军事频道
+重要活动
+视频专辑
+学习专题
+报道
+学习新视界
+党代会报告
+新闻联播
+中共中央举行纪念乔石同志诞辰100周年座谈会 习近平发表重要讲话
+《求是》杂志发表习近平总书记重要文章《深入推进党的自我革命》
+习近平听取李家超述职报告
+中央经济工作会议在北京举行 习近平发表重要讲话
+打开
+听原著
+听法律
+听党规
+听科技
+听健康
+听文化
+听理论
+听音乐
+听诗文
+听广播剧
+听长书
+1234
+《习近平谈治国理政》第四卷
+学习理论
+打开
+深入推进新时代国有企业党建工作
+坚持守正创新 担负起新时代新的文化使命
+培育发展新质生产力的新动能
+不断提升国家文化软实力和中华文化影响力
+从道理学理哲理上深化对党的自我革命的认识
+把培养造就新时代高水平教师队伍落到实处
+高擎新时代文化建设的思想旗帜
+龙的起源、原型与演变
+城市新兴风险需要综合治理
+坚持用科学方法推动改革行稳致远
+发挥制度优势 凝聚奋进力量
+坚持“两个结合”推进马克思主义中国化时代化——“首都当代中国马克思主义论坛·2024”发言摘登
+以系统观念加强党的建设
+积极参与构建公正合理的全球治理体系
+牢记殷切嘱托 争当改革先锋
+中国经济长期向好的支撑条件和基本趋势没有变
+深化价格改革完善要素市场制度和规则
+努力使党史党建学科建设更加精彩
+文化广场
+打开
+梵净山下云舍间
+日常生活有文韵
+我是一条洄游的鱼
+麦浪滚滚
+江中题刻白鹤梁
+柏子和柏叶
+大列巴和冰啤酒
+一院子的“生长”
+悠悠漳溪河
+打开
+123456
+宪法精神大家谈|张翔:备案审查制度取得巨大的进步
+法治新闻
+法治时评
+ 政法
+法律法规
+普法课堂
+法治视频
+法治人物
+知识产权
+全国人大常委会首次将年度备案审查报告及审议意见交由有关制定机关研究处理
+司法部党组传达学习中央经济工作会议精神
+聚焦发展蓝图 勇担职责使命 推动基层法学会工作再创佳绩
+地方规范性文件数据库不断扩容 全国省级数据库已收录各类规范性文件38万多件
+把政府行为全面纳入法治轨道
+以高质量政府立法服务保障高质量发展
+陕西对33项专利密集型产品进行奖补
+记山东蒙阴法院民事审判一庭庭长魏善辉
+山东青岛前10个月有效发明专利拥有量8.32万件
+销售假冒品牌商品价值190余万元 一家三口被判刑
+宪法书签DIY活动征集公告
+今日说法(2024)
+法治深壹度(2024)
+天网(2024)
+全国百强期刊(选)
+社科词条库
+首页-学习强国-学习慕课
+学习强国-首页-国图公开课
+打开
+永远的丰碑
+经典著作
+红色记忆
+党史学习
+永远的丰碑
+查看全部
+李大钊:中国共产党的创始人之一
+蔡和森:中国共产党工人运动领袖
+董必武:中国共产党的创始人之一
+何叔衡:中国共产党的创始人之一
+方志敏:伟大的共产主义战士
+刘胡兰:生的伟大死的光荣
+马本斋:百战百胜的回民支队司令员
+左 权:中国工农红军高级指挥员
+视频专区
+查看全部
+享誉中外的科学家和教育家——卢嘉锡
+生是为中国 死是为中国——刘伯坚
+杰出的红军指挥员——蔡申熙
+党的早期农民运动的领导人——罗学瓒
+精神研究
+建党精神
+井冈山精神
+苏区精神
+长征精神
+遵义会议精神
+延安精神
+抗战精神
+西柏坡精神
+大别山精神
+抗美援朝精神
+“两弹一星”精神
+雷锋精神
+焦裕禄精神
+大庆精神(铁人精神)
+红旗渠精神
+塞罕坝精神
+抗震救灾精神
+载人航天精神
+脱贫攻坚精神
+抗疫精神
+“三牛”精神
+科学家精神
+企业家精神
+探月精神
+调查研究论
+打开
+调研与写作方法谈
+打开
+调研成果选
+打开
+查看全部
+教育头条
+思政与德育
+教师
+学前教育
+中小学教育
+高等教育
+升学与就业
+职业教育
+12345678
+哈尔滨工业大学冰雪体育课“燃动”上线
+应用型学前教育专业虚拟教研室成立
+•
+哈尔滨工程大学:这个水下机器人为何能获得大赛冠军?
+•
+内蒙古大学:弘扬教育家精神 共筑教育强国梦
+•
+把培养造就新时代高水平教师队伍落到实处
+武汉大学人工智能学院成立
+河北建立校园食品安全举报奖励机制
+广东发布《关于明确中小学生社会竞赛活动若干管理要求的通知》
+尊师惠师,让教师更有获得感!
+动态与政策
+技能提升
+竞赛比武
+大国工匠
+技工技师摇篮
+技能课堂
+山西:以技能竞赛为抓手 培养高素质技能人才
+天津发布制造业新质生产力人才需求目录
+陕西:鼓励用人单位自主开展职业技能等级认定
+共和国荣光
+最美奋斗者
+时代楷模
+“双百”人物
+道德模范
+改革先锋
+王永志
+王振义
+李振声
+黄宗德
+迪尔玛·罗塞芙
+王小谟
+赵忠贤
+巴依卡·凯力迪别克
+田华
+许振超
+张晋藩
+黄大年
+路生梅
+张卓元
+张燮林
+杜富国
+钱七虎
+聂海胜
+马毛姐
+王书茂
+王占山
+王兰花
+艾爱国
+石光银
+吕其明
+廷·巴特尔
+刘贵今
+孙景坤
+买买提江·吾买尔
+李宏塔
+吴天一
+辛育龄
+张桂梅
+陆元九
+陈红军
+林丹
+卓嘎
+周永开
+柴云振
+郭瑞祥
+打开
+关注健康
+健康知识
+人物风采
+心理辅导
+全民健身
+老龄生活
+进一步加强医保基金监管
+降低中成药价格 让广大群众受益
+2029年全国中医优势专科总规模达万个
+提高特医食品安全性可及性
+第十批!国家药品集采“开箱”
+广西医保助推看病购药报销“不出村”
+老年骨折预防系列:如何防跌倒
+老年骨折预防系列:改善平衡能力防跌倒
+孩子得了哮喘,家长该怎么做?
+掉发≠脱发 如何判断自己是否脱发?
+打开
+环境智能!高产稳产!中国科学家新成果开启作物育种新时代
+华龙洞遗址为人类发展脉络又添新注脚
+地球科学领域“元古大模型”上线
+星震学方法可有效探测类太阳恒星小尺度磁场
+我国将构建天地一体化算力网络
+激发产业发展新动能|鲜橙坐上无人机 果农丰收展笑颜——低空经济下的湖北秭归农业革新见闻
+“中国天眼”拓展人类观天极限
+三峡工程开工建设30年来效益显著
+科技新闻
+科技思想研究
+数字时代
+走遍中国
+国家历史文化名城
+中国历史名镇名村
+中国历史文化街区
+山东邹城:邹鲁灵秀 大美峄山
+辽宁大连滨海国家地质公园
+云南·玉龙雪山
+中国相册
+最美中国
+最美中国人
+历史瞬间
+图片故事
+画报中国
+粤港澳大湾区不眠夜
+东北地区筑牢生态屏障
+城乡建设忙
+打开
+12345678910111213141516171819202122232425262728293031323334
+习近平在视察信息支援部队时强调 努力建设一支强大的现代化信息支援部队 推动我军网络信息体系建设跨越发展
+中国军网
+环球视野
+打开
+习近平外交思想研究
+Xi's Time
+世界眼中的习近平
+国际问题研究
+世界文明研究
+中国特色大国外交的“和合”逻辑及其实践
+2024-12-17
+积极参与构建公正合理的全球治理体系
+2024-12-16
+中国特色大国外交的统筹逻辑及其实践
+2024-12-16
+完善全球治理,二十国集团应该做什么?
+2024-12-13
+构建人类命运共同体所体现的世界观秩序观价值观
+2024-12-12
+续写全球互联网发展与治理的下一个十年华章
+2024-12-11
+推动构建网络空间命运共同体迈向新阶段
+2024-12-10
+共建“一带一路”拓展共赢发展新空间
+2024-12-09
+新闻馆
+打开
+博物馆
+打开
+国情馆
+打开
+文明馆
+打开
+全国图书馆
+全国博物馆
+中国国家博物馆
+中国国家图书馆
+国家大剧院
+故宫博物院
+敦煌研究院
+中国美术馆
+中国出版集团强国版
+人民出版社强国版
+学习出版社强国版
+五洲传播出版社强国版
+人民文学出版社强国版
+中华书局强国版
+三联书店强国版
+龙源期刊网强国版
+新华书店强国版
+中国摄影出版社强国版
+外研社强国版
+视觉中国强国版
+《辞海》网络版
+打开
+打开
+
+马克思恩格斯全集
+
+列宁全集
+
+毛泽东选集
+
+邓小平文选
+
+江泽民文选
+
+胡锦涛文选
+
+习近平谈治国理政(第一卷)
+
+习近平谈治国理政(第二卷)
+
+习近平关于实现中华民族伟大复兴的中国梦论述摘编
+
+习近平关于社会主义经济建设论述摘编
+
+习近平关于社会主义政治建设论述摘编
+
+习近平关于社会主义文化建设论述摘编
+
+习近平关于社会主义社会建设论述摘编
+
+习近平关于社会主义生态文明建设论述摘编
+
+习近平关于协调推进“四个全面”战略布局论述摘编
+
+习近平关于严明党的纪律和规矩论述摘编
+
+知之深 爱之切
+
+摆脱贫困
+
+之江新语
+
+干在实处 走在前列
+
+站内搜索
+我的学习
+我的书房
+我的积分
+我要投稿
+记者培训
+建议反馈
+智能审校
+舆情监测
+返回顶部
+下载学习强国app
+服务热线
+12361
+值班电话
+010-55624303
+010-55624311
+友情链接
+人民网新华网中国网央视网国际在线中国日报网中国青年网中国经济网中国新闻网光明网央广网中工网党建网中青在线中国军网法治网求是网中国网信网中国文明网中国政府网教育部网站国防部网站文化和旅游部网站国新办网站中国扫黄打非网女性之声中国报业中央网信办举报中心千龙网中国社会科学网中国科技网中国农业新闻网西影网中国法律服务网中国普法网中国西藏网中国妇女网
+
+服务电话:12361 值班电话:010-55624303、010-55624311
+
+中央宣传部宣传舆情研究中心版权所有 未经书面授权禁止使用
+
+Copyright© 2018-2024 by www.xuexi.cn. all rights reserved
+
+互联网新闻信息服务许可证编号:10120190024互联网药品信息服务资格证书编号:(京)-非经营性-2024-0040
+
+ICP备案/许可证编号:京ICP备18000311号-1京公网安备11010102006000号
+
+违法和不良信息举报电话:010-55624652 传真:010-67010175
+
+字体支持:北京北大方正电子有限公司 北京汉仪科印信息技术有限公司 北京华康信息技术有限公司
\ No newline at end of file
diff --git a/test/webpage_samples/task1/922b31/link_dict.json b/test/webpage_samples/task1/922b31/link_dict.json
new file mode 100644
index 0000000..3110d36
--- /dev/null
+++ b/test/webpage_samples/task1/922b31/link_dict.json
@@ -0,0 +1,391 @@
+{
+ "党网 · 时政": "http://cpc.people.com.cn/",
+ "人事": "http://renshi.people.com.cn/",
+ "反腐": "http://fanfu.people.com.cn/",
+ "理论": "http://theory.people.com.cn/",
+ "党史": "http://dangshi.people.com.cn/",
+ "党建": "http://dangjian.people.com.cn/",
+ "经济 · 科技": "http://finance.people.com.cn/",
+ "社会 · 法治": "http://society.people.com.cn/",
+ "文旅 · 体育": "http://ent.people.com.cn/",
+ "健康 · 生活": "http://health.people.com.cn/",
+ "国际": "http://world.people.com.cn/",
+ "军事": "http://military.people.com.cn/",
+ "港澳": "http://hm.people.com.cn/",
+ "台湾": "http://tw.people.com.cn/",
+ "教育": "http://edu.people.com.cn/",
+ "科普": "http://kpzg.people.com.cn/",
+ "人民网评": "http://opinion.people.com.cn/GB/223228/index.html",
+ "三评": "http://opinion.people.com.cn/GB/8213/420650/index.html",
+ "人民财评": "http://opinion.people.com.cn/GB/427456/index.html",
+ "人民来论": "http://opinion.people.com.cn/GB/431649/index.html",
+ "人民访谈": "http://fangtan.people.com.cn/",
+ "人民体谈": "http://opinion.people.com.cn/GB/427456/437949/index.html",
+ "领导留言板": "http://liuyan.people.com.cn/",
+ "强国论坛": "http://bbs1.people.com.cn/board/1.html",
+ "828企业服务平台": "http://828.people.com.cn/",
+ "人民建议": "https://liuyan.people.com.cn/rmjy",
+ "人民投诉": "https://weiquan.people.com.cn/#/",
+ "“大思政课”云平台": "http://app.people.cn/sizheng",
+ "视频": "http://v.people.cn/",
+ "图片": "http://pic.people.com.cn/",
+ "图解": "http://graphicnews.people.com.cn/",
+ "灵境·人民艺术馆": "http://art.people.com.cn/",
+ "聚力微光": "http://link.people.com.cn/",
+ "京": "http://bj.people.com.cn/",
+ "津": "http://tj.people.com.cn/",
+ "冀": "http://he.people.com.cn/",
+ "晋": "http://sx.people.com.cn/",
+ "蒙": "http://nm.people.com.cn/",
+ "辽": "http://ln.people.com.cn/",
+ "吉": "http://jl.people.com.cn/",
+ "黑": "http://hlj.people.com.cn/",
+ "沪": "http://sh.people.com.cn/",
+ "苏": "http://js.people.com.cn",
+ "浙": "http://zj.people.com.cn/",
+ "皖": "http://ah.people.com.cn/",
+ "闽": "http://fj.people.com.cn/",
+ "赣": "http://jx.people.com.cn/",
+ "鲁": "http://sd.people.com.cn/",
+ "豫": "http://henan.people.com.cn/",
+ "鄂": "http://hb.people.com.cn/",
+ "湘": "http://hn.people.com.cn/",
+ "粤": "http://gd.people.com.cn/",
+ "桂": "http://gx.people.com.cn/",
+ "琼": "http://hi.people.com.cn/",
+ "渝": "http://cq.people.com.cn/",
+ "川": "http://sc.people.com.cn/",
+ "黔": "http://gz.people.com.cn/",
+ "滇": "http://yn.people.com.cn/",
+ "藏": "http://xz.people.com.cn/",
+ "陕": "http://sn.people.com.cn/",
+ "甘": "http://gs.people.com.cn/",
+ "青": "http://qh.people.com.cn/",
+ "宁": "http://nx.people.com.cn/",
+ "新": "http://xj.people.com.cn/",
+ "鹏": "http://sz.people.com.cn/",
+ "雄安": "http://www.rmxiongan.com/",
+ "毛主席纪念堂": "http://cpc.people.com.cn/GB/69112/113427/index.html",
+ "周恩来纪念网": "http://zhouenlai.people.cn/",
+ "邓小平纪念网": "http://www.dengxiaopingnet.com/",
+ "中央社会工作部": "https://www.zyshgzb.gov.cn/",
+ "工会新闻网": "http://acftu.people.com.cn/",
+ "中国侨联": "http://www.chinaql.org/GB/index.html",
+ "学习强国": "https://www.xuexi.cn/",
+ "中共中央党史和文献研究院": "http://www.dswxyjy.org.cn/",
+ "中组部12380举报网": "http://www.12380.gov.cn/",
+ "全国哲学社科工作办": "http://www.nopss.gov.cn/",
+ "旗帜网": "http://www.qizhiwang.org.cn/",
+ "国家保密局": "http://www.gjbmj.gov.cn/",
+ "文化企业社会责任报告发布平台": "http://ent.people.com.cn/GB/436846/441076/index.html",
+ "中国国民党革命委员会": "http://www.minge.gov.cn/",
+ "“人民消费”中消协教育课堂": "http://finance.people.com.cn/GB/8215/452688/index.html",
+ "传播内容认知全国重点实验室": "http://www.sklccc.com/",
+ "人民审校": "https://pditr.people.cn/",
+ "智能写作": "https://xy.people.cn/",
+ "白泽": "http://www.people.com.cn/baize/index.html",
+ "人民网客户端": "http://www.people.cn/app/download.html",
+ "举报": "https://www.12377.cn/",
+ "登录": "http://sso.people.com.cn/login?fromUrl=http://people.com.cn",
+ "人民日报": "http://www.people.com.cn/GB/50142/104580/index.html",
+ "人民日报海外版": "http://paper.people.com.cn/rmrbhwb/paperindex.htm",
+ "中国汽车报": "http://www.cnautonews.com/",
+ "中国能源报": "http://paper.people.com.cn/zgnyb/paperindex.htm",
+ "健康时报": "http://paper.people.com.cn/jksb/paperindex.htm",
+ "证券时报": "http://www.stcn.com/",
+ "国际金融报网": "http://www.ifnews.com/",
+ "讽刺与幽默": "http://paper.people.com.cn/fcyym/paperindex.htm",
+ "中国城市报": "http://paper.people.com.cn/zgcsb/paperindex.htm",
+ "新闻战线": "http://paper.people.com.cn/xwzx/paperindex.htm",
+ "人民论坛": "http://paper.people.com.cn/rmlt/paperindex.htm",
+ "环球人物": "http://www.hqrw.com.cn/",
+ "中国经济周刊": "http://www.ceweekly.cn/",
+ "民生周刊": "http://www.msweekly.com/",
+ "国家人文历史": "http://www.gjrwls.com/",
+ "人民周刊": "http://paper.people.com.cn/rmzk/paperindex.htm",
+ "人民数字": "http://www.rmsznet.com/",
+ "全国重点实验室": "http://sklccc.com.cn/",
+ "环球网": "http://www.huanqiu.com/",
+ "海外网": "http://www.haiwainet.cn/",
+ "人民图片": "http://vip.people.com.cn/",
+ "人民网研究院": "http://yjy.people.com.cn/",
+ "人民慕课": "http://www.peoplemooc.com/",
+ "人民网智慧党建体验中心": "http://capital.people.com.cn/GB/440975/index.html",
+ "人民云": "https://www.peopleyun.cn/",
+ "当前经济形势怎么看?": "http://politics.people.com.cn/n1/2024/1217/c1001-40383903.html",
+ "解读2024年中央经济工作会议精神": "http://finance.people.com.cn/n1/2024/1217/c1004-40383449.html",
+ "坚定必胜信心,把各方面积极因素转化为发展实绩": "http://opinion.people.com.cn/n1/2024/1215/c1003-40382183.html",
+ "深入领会对经济工作的规律性认识": "http://opinion.people.com.cn/n1/2024/1216/c1003-40382557.html",
+ "迎难而上 坚持干字当头": "http://opinion.people.com.cn/n1/2024/1217/c434878-40383565.html",
+ "奋发有为": "http://finance.people.com.cn/n1/2024/1217/c1004-40383442.html",
+ "本固枝荣:坚持和落实“两个毫不动摇”": "http://finance.people.com.cn/GB/459357/459634/459635/index.html",
+ "中共中央举行纪念乔石同志诞辰100周年座谈会 习近平发表重要讲话": "http://pic.people.com.cn/n1/2024/1216/c426981-40383389.html",
+ "中国式现代化一个都不能少": "http://cpc.people.com.cn/n1/2024/1217/c164113-40383703.html",
+ "临猗黄河大桥全面通车": "http://pic.people.com.cn/n1/2024/1217/c1016-40383785.html",
+ "超八成国产牛油果,产自云南这一边境县": "http://yn.people.com.cn/n2/2024/1217/c372455-41078032.html",
+ "考研冲刺": "http://pic.people.com.cn/n1/2024/1217/c1016-40384011.html",
+ "河南内黄:“冬闲”人不闲 增收致富忙": "http://henan.people.com.cn/n2/2024/1217/c351638-41077821.html",
+ "习近平的乡土情": "http://politics.people.com.cn/n1/2024/1217/c1001-40383440.html",
+ "擦亮和美乡村幸福底色": "http://politics.people.com.cn/n1/2024/1217/c1001-40383985.html",
+ "学习·故事|习近平:\"老梁,给你带了一份纪念品\"": "http://cpc.people.com.cn/n1/2024/1217/c164113-40383545.html",
+ "李强主持国务院第十一次专题学习": "http://politics.people.com.cn/n1/2024/1217/c1024-40383919.html",
+ "庆祝澳门回归25周年": "http://hm.people.com.cn/GB/42280/459755/index.html",
+ "初心如磐,\"莲花卫士\"护濠江": "http://hm.people.com.cn/n1/2024/1217/c42272-40383457.html",
+ "公报全文": "http://politics.people.com.cn/n1/2024/0719/c1024-40280667.html",
+ "专题": "http://cpc.people.com.cn/GB/67481/459166/index.html",
+ "中国制造向\"新\"攀登 折射经济韧性活力": "http://finance.people.com.cn/n1/2024/1217/c1004-40383926.html",
+ "传统产业创新底色足、发展潜力大": "http://finance.people.com.cn/n1/2024/1217/c1004-40383766.html",
+ "全谷物消费带动节粮减损 提高国民营养健康水平": "http://finance.people.com.cn/n1/2024/1217/c1004-40383764.html",
+ "活力足动能强 \"黄金大通道\"效应日益凸显": "http://finance.people.com.cn/n1/2024/1217/c1004-40383927.html",
+ "让中华体育精神为强国建设提供磅礴能量": "http://ent.people.com.cn/n1/2024/1217/c1012-40383787.html",
+ "深耕细分赛道,做强做优主业!陈吉宁调研企业": "http://sh.people.com.cn/n2/2024/1217/c134768-41078022.html",
+ "浦东首创居民自治金项目试点从居民区推向乡村": "http://sh.people.com.cn/n2/2024/1217/c134768-41078023.html",
+ "要闻": "http://www.people.com.cn/GB/59476/index.html",
+ "王毅:元首外交书写恢弘新篇章": "http://world.people.com.cn/n1/2024/1217/c1002-40384070.html",
+ "王毅谈2024年中国外交五大亮点": "http://world.people.com.cn/n1/2024/1217/c1002-40383962.html",
+ "2024中国正能量网络精品征集展播活动启动": "http://politics.people.com.cn/n1/2024/1217/c1001-40383463.html",
+ "中国过境免签政策全面放宽优化": "http://society.people.com.cn/n1/2024/1217/c1008-40383842.html",
+ "关于第九届全国道德模范候选人的公示": "http://politics.people.com.cn/n1/2024/1216/c1001-40382580.html",
+ "外交部:欢迎外国朋友继续\"种草\"中国": "http://world.people.com.cn/n1/2024/1217/c1002-40384087.html",
+ "我国加快以标准提升引领原材料工业优化升级": "http://finance.people.com.cn/n1/2024/1217/c1004-40383951.html",
+ "中美金融工作组举行第七次会议": "http://world.people.com.cn/n1/2024/1217/c1002-40383964.html",
+ "稳外贸、稳外资 明年工作这么干": "http://finance.people.com.cn/n1/2024/1217/c1004-40383653.html",
+ "民政部等三部门联合印发《乡村地名建设指南1.0版》": "http://society.people.com.cn/n1/2024/1217/c1008-40383917.html",
+ "事关央企上市公司市值管理!国务院国资委出新规": "http://finance.people.com.cn/n1/2024/1217/c1004-40384052.html",
+ "中国海警局新闻发言人就菲向非法\"坐滩\"仁爱礁军舰运补发表谈话": "http://military.people.com.cn/n1/2024/1217/c1011-40384088.html",
+ "我国成功发射航天宏图PIESAT-2 09~12星": "http://finance.people.com.cn/n1/2024/1217/c1004-40383843.html",
+ "看点解析": "http://finance.people.com.cn/n1/2024/1217/c1004-40384071.html",
+ "累计支持建设项目已达116个 智慧农业发展开启\"加速度\"": "http://finance.people.com.cn/n1/2024/1217/c1004-40383765.html",
+ "办实事|立交桥下人行道及非机动车道常年积水 江西南昌:已解决": "http://jx.people.com.cn/n2/2024/1217/c186330-41077817.html",
+ "云南省委原常委、省政府原副省长李石松严重违纪违法被开除党籍和公职": "http://society.people.com.cn/n1/2024/1217/c1008-40384069.html",
+ "科学摄入六大营养素 预防呼吸道传染病": "http://health.people.com.cn/n1/2024/1217/c14739-40383772.html",
+ "观点": "http://opinion.people.com.cn/",
+ "深度": "http://theory.people.com.cn/GB/148980/index.html",
+ "科技赋能农机 田野拥抱智慧": "http://finance.people.com.cn/n1/2024/1217/c1004-40383423.html",
+ "中国有信心推动经济持续向好": "http://world.people.com.cn/n1/2024/1217/c1002-40383446.html",
+ "金融赋能 托起幸福“夕阳红”": "http://opinion.people.com.cn/n1/2024/1217/c427456-40383789.html",
+ "马鞍山雨山区:“三中心”落地,“一站式”助企": "http://ah.people.com.cn/n2/2024/1217/c227131-41078196.html",
+ "“毫厘”间练就“独门绝技”": "http://fj.people.com.cn/n2/2024/1217/c181466-41077960.html",
+ "时习之": "http://cpc.people.com.cn/xuexi/GB/433640/index.html",
+ "知行": "http://cpc.people.com.cn/xuexi/GB/457576/index.html",
+ "故事": "http://cpc.people.com.cn/GB/67481/458837/index.html",
+ "一见": "http://politics.people.com.cn/GB/8198/434128/index.html",
+ "跟着总书记学党史": "http://cpc.people.com.cn/GB/67481/444924/index.html",
+ "整治形式主义为基层减负工作平台": "http://zzxszy.people.cn",
+ "党的二十大精神理论大讲堂": "http://theory.people.com.cn/GB/40557/457759/index.html",
+ "党员学习园地": "http://dangjian.people.com.cn/GB/136058/448887/index.html",
+ "推动新旧动能平稳接续转换": "http://theory.people.com.cn/n1/2024/1217/c40531-40383544.html",
+ "坚持用科学方法推动改革行稳致远": "http://theory.people.com.cn/n1/2024/1217/c40531-40383538.html",
+ "吉林发布省管干部任职前公示公告": "http://renshi.people.com.cn/n1/2024/1217/c139617-40383634.html",
+ "湖北咸宁:提升纪检监察建议质效": "http://fanfu.people.com.cn/n1/2024/1217/c64371-40383528.html",
+ "辽宁专项整治高标准农田建设突出问题": "http://fanfu.people.com.cn/n1/2024/1217/c64371-40383526.html",
+ "毛泽东的读书治学之道": "http://cpc.people.com.cn/n1/2024/1217/c443712-40383535.html",
+ "鲁南第二军分区攻坚大王庙": "http://cpc.people.com.cn/n1/2024/1217/c443712-40383537.html",
+ "查看中央文件": "http://cpc.people.com.cn/GB/67481/431391/index.html",
+ "下载客户端": "http://health.people.com.cn/GB/408835/428895/index.html",
+ "山东青岛网友为马拉松建言:扩大赛事规模,提升办赛质量": "http://sd.people.com.cn/n2/2024/1215/c364532-41076137.html",
+ "河北网友:优化冀时办APP功能,上线无房证明开具服务": "http://liuyan.people.com.cn/threads/content?tid=22152124",
+ "2024网上群众工作大会|": "http://leaders.people.com.cn/GB/178291/218130/458754/459616/index.html",
+ "“我给两会捎句话”启动": "http://leaders.people.com.cn/GB/178291/218130/458754/459687/index.htmlhttp://leaders.people.com.cn/n1/2024/1212/c58278-40380976.html",
+ "湖北罗田回复网友:尽快优化并开通公交线路": "http://hb.people.com.cn/n2/2024/1215/c192237-41076179.html",
+ "网友反映车辆违停问题 山西太原:交警部门将加强巡逻及时处理": "https://liuyan.people.com.cn/threads/content?tid=21776250\n",
+ "网友咨询道路何时修通 河南许昌:将于2025年5月完工": "https://liuyan.people.com.cn/threads/content?tid=21665339",
+ "金台视线|让社区食堂实现可持续发展": "http://leaders.people.com.cn/n1/2024/0603/c58278-40249095.html",
+ "身边事|工地围挡长期未拆 影响通行": "http://leaders.people.com.cn/n1/2024/0603/c58278-40249097.html",
+ "建议|整治中小学周边游戏推广": "http://leaders.people.com.cn/n1/2024/0603/c58278-40249100.html",
+ "反馈|加大巡查力度 守护水域生态": "http://leaders.people.com.cn/n1/2024/0603/c58278-40249096.html",
+ "查看留言": "http://liuyan.people.com.cn/home",
+ "我要留言": "http://liuyan.people.com.cn/login",
+ "人民网记者遍神州": "http://unn.people.com.cn/difang/GB/387272/index.html",
+ "人民网记者遍全球": "http://www.people.com.cn/GB/8722/index1.html",
+ "山东手造丨淄博琉璃灯工:火中的雕塑": "http://v.people.cn/n1/2024/1217/c459744-40383875.html",
+ "回顾2024年中国军事大场面": "https://mr.people.cn/davmu/share/mp/video/2024/12/XKRXLIGzgE/index.html",
+ "复兴之路|巍巍纪念塔 拳拳追思情": "https://mr.people.cn/davmu/share/mp/video/2024/12/Rmo5AC8nKg/index.html",
+ "党的二十大专题": "http://cpc.people.com.cn/20th/",
+ "总书记的人民情怀": "http://cpc.people.com.cn/GB/67481/457481/index.html",
+ "新思想引领新时代改革开放": "http://cpc.people.com.cn/GB/67481/459156/index.html",
+ "奋进强国路 阔步新征程": "http://politics.people.com.cn/GB/8198/459404/index.html",
+ "党纪学习教育": "http://cpc.people.com.cn/GB/67481/458835/index.html",
+ "“行进中国”调研行": "http://finance.people.com.cn/GB/458971/index.html",
+ "35个!2024年国家先进制造业集群名单公布": "http://finance.people.com.cn/n1/2024/1217/c1004-40383711.html",
+ "对话企业家": "http://finance.people.com.cn/GB/8215/441842/441919/index.html",
+ "人民会客厅": "http://finance.people.com.cn/GB/8215/447389/index.html",
+ "消费维权": "https://weiquan.people.com.cn/#/\n",
+ "开放谈:以创新引领数字贸易高质量发展": "http://finance.people.com.cn/n1/2024/1217/c1004-40383425.html",
+ "延续回升态势 全年目标有望顺利实现": "http://finance.people.com.cn/n1/2024/1217/c1004-40383656.html",
+ "这份方案促零售业创新提升": "http://finance.people.com.cn/n1/2024/1217/c1004-40383718.html",
+ "我国避寒游、冰雪游南北竞相升温": "http://finance.people.com.cn/n1/2024/1217/c1004-40383679.html",
+ "读懂“川菜热”背后的烟火中国": "http://finance.people.com.cn/n1/2024/1217/c1004-40383706.html",
+ "电动汽车供电设备强制认证将解决哪些问题和隐患?": "http://finance.people.com.cn/n1/2024/1217/c1004-40383713.html",
+ "科技": "http://finance.people.com.cn/GB/70846/index.html",
+ "生态": "http://env.people.com.cn/",
+ "喜看“三农”新图景:农业更高效 乡村更美好": "http://finance.people.com.cn/n1/2024/1217/c1004-40383666.html",
+ "我国成功发射卫星互联网低轨卫星": "http://finance.people.com.cn/n1/2024/1217/c1004-40383721.html",
+ "新研究揭示人类基因流动复杂历史": "http://finance.people.com.cn/n1/2024/1217/c1004-40383726.html",
+ "中国核电在运在建规模升至世界第一": "http://kpzg.people.com.cn/n1/2024/1217/c404214-40383484.html",
+ "流感高发,如何预防与应对?": "http://kpzg.people.com.cn/n1/2024/1217/c404214-40383504.html",
+ "解锁人民网“梦幻灵境”": "http://ai.people.com.cn/",
+ "“万商万品 万象焕新”百日直播行动": "http://finance.people.com.cn/GB/8215/448875/457676/index.html",
+ "一吨煤的绿色转型": "http://kpzg.people.com.cn/n1/2024/1217/c404214-40383487.html",
+ "司法“精耕细作” “滴灌”乡村田野": "http://society.people.com.cn/n1/2024/1217/c1008-40383602.html",
+ "科技赋能农机 田野拥抱智慧": "http://society.people.com.cn/n1/2024/1217/c1008-40383677.html",
+ "千年古镇,法庭绘就新“枫”景": "http://society.people.com.cn/n1/2024/1217/c1008-40383643.html",
+ "黑龙江:构建“快进快退”破产案件审判机制": "http://society.people.com.cn/n1/2024/1217/c1008-40383651.html",
+ "广东东莞二院:法庭与司法分局联手化解租赁纠纷": "http://society.people.com.cn/n1/2024/1217/c1008-40383663.html",
+ "业委会换了,电梯更换还能继续履行吗?": "http://society.people.com.cn/n1/2024/1217/c1008-40383623.html",
+ "国家大学科技园为科技成果转化搭建重要平台": "http://edu.people.com.cn/n1/2024/1217/c1006-40383603.html",
+ "滚动新闻": "http://military.people.com.cn/GB/172467/index.html",
+ "大学": "http://edu.people.com.cn/GB/227065/index.html",
+ "让优质教育资源润泽雪域高原": "http://edu.people.com.cn/n1/2024/1217/c1006-40383555.html",
+ "体教融合,为振兴三大球强基固本": "http://edu.people.com.cn/n1/2024/1217/c1006-40383600.html",
+ "农业研学应“研”之有道": "http://edu.people.com.cn/n1/2024/1217/c1006-40383649.html",
+ "贵阳综合保税区今年以来引才近1400人": "http://edu.people.com.cn/n1/2024/1217/c1006-40383695.html",
+ "积极构建中国自主的教育学知识体系": "http://edu.people.com.cn/n1/2024/1217/c1006-40383676.html",
+ "青海西宁:非遗唐卡“画”进高校课堂": "http://edu.people.com.cn/n1/2024/1217/c1006-40383716.html",
+ "青城山冬景如画": "http://society.people.com.cn/n1/2024/1217/c1008-40383681.html",
+ "四川广安:最后冲刺抢收柠檬": "http://society.people.com.cn/n1/2024/1217/c1008-40383682.html",
+ "打造惠及世界的“幸福路”": "http://world.people.com.cn/n1/2024/1217/c1002-40383433.html",
+ "外国留学生走进重庆北碚,开启“村”游": "http://world.people.com.cn/n1/2024/1217/c1002-40383435.html",
+ "联合国防治荒漠化大会上的中国印象": "http://world.people.com.cn/n1/2024/1217/c1002-40383434.html",
+ "埃及专家:应对重重挑战 “全球南方”需要中国贡献": "http://world.people.com.cn/n1/2024/1217/c1002-40383655.html",
+ "中美合作造福两国,更是大势所趋、世界期待": "http://world.people.com.cn/n1/2024/1217/c1002-40383715.html",
+ "汉语培训班为尼泊尔培养240名中文旅游人才": "http://world.people.com.cn/n1/2024/1217/c1002-40383568.html",
+ "沙特大力开发天然气资源": "http://world.people.com.cn/n1/2024/1217/c1002-40383472.html",
+ "埃及和约旦领导人呼吁立即在加沙停火": "http://world.people.com.cn/n1/2024/1217/c1002-40383584.html",
+ "普京:俄对美国拟部署中程导弹表示担忧": "http://world.people.com.cn/n1/2024/1217/c1002-40383564.html",
+ "美国威斯康辛州发生校园枪击案造成2死6伤": "http://world.people.com.cn/n1/2024/1217/c1002-40383554.html",
+ "也门胡塞武装称向以色列发射高超音速导弹": "http://world.people.com.cn/n1/2024/1217/c1002-40383547.html",
+ "韩国宪法法院要求尹锡悦23日前提交弹劾案答辩": "http://world.people.com.cn/n1/2024/1217/c1002-40383534.html",
+ "广东省珠海市大力解决驻军部队难题": "http://military.people.com.cn/n1/2024/1217/c1011-40383707.html",
+ "发挥老兵余热 讲好国防故事": "http://military.people.com.cn/n1/2024/1217/c1011-40383712.html",
+ "第76集团军某旅评功评奖坚持公平公正公开": "http://military.people.com.cn/n1/2024/1217/c1011-40383685.html",
+ "海军航空大学某大队舰载机陆基起降训练掠影": "http://military.people.com.cn/n1/2024/1217/c1011-40383675.html",
+ "新疆军区某综合训练基地科学制订“病号食谱”": "http://military.people.com.cn/n1/2024/1217/c1011-40383654.html",
+ "空中加油技术的“前世今生”": "http://military.people.com.cn/n1/2024/1217/c1011-40383714.html",
+ "朔尔茨未通过联邦议院信任投票": "http://world.people.com.cn/n1/2024/1217/c1002-40383615.html",
+ "圣彼得堡举办马戏主题展": "http://world.people.com.cn/n1/2024/1217/c1002-40383684.html",
+ "和平力量相遇深蓝航道": "http://military.people.com.cn/n1/2024/1217/c1011-40383697.html",
+ "网联中国": "http://unn.people.com.cn/GB/393135/index.html",
+ "大河之南 兴起新文旅": "http://henan.people.com.cn/n2/2024/1217/c351638-41077627.html",
+ "安徽省检察院举行开放日活动 代表委员建言献策": "http://ah.people.com.cn/n2/2024/1217/c227131-41078054.html",
+ "贵州举行森林防火主题宣传活动": "http://gz.people.com.cn/n2/2024/1217/c222152-41078588.html",
+ "“简牍学文库”项目启动暨编纂出版座谈会举行": "http://gs.people.com.cn/n2/2024/1217/c183348-41078573.html",
+ "宁夏:六盘山下冰雪赛事“燃”": "http://nx.people.com.cn/n2/2024/1217/c192493-41078173.html",
+ "河钢全球首条氢冶金绿色汽车板连铸生产线投产": "http://he.people.com.cn/n2/2024/1216/c192235-41077558.html",
+ "老工业基地“上演”新故事": "http://hlj.people.com.cn/GB/409817/411585/index.html",
+ "北京“守夜人”": "http://bj.people.com.cn/GB/411564/index.html",
+ "“何以中国”的山东故事": "http://sd.people.com.cn/GB/181249/411689/index.html",
+ "“没想到中国乡村这么有魅力”": "http://ent.people.com.cn/n1/2024/1217/c1012-40383611.html",
+ "文化": "http://culture.people.com.cn/GB/172318/index.html",
+ "旅游": "http://travel.people.com.cn/GB/41636/index.html",
+ "体育": "http://sports.people.com.cn/GB/436800/index.html",
+ "赴一场辽金历史文化盛宴": "http://ent.people.com.cn/n1/2024/1217/c1012-40383427.html",
+ "2025春天,到潮汕奔赴一场英雄之舞": "http://ent.people.com.cn/n1/2024/1217/c1012-40383563.html",
+ "古蜀文明保护传承二期工程开启": "http://ent.people.com.cn/n1/2024/1217/c1012-40383580.html",
+ "壳丘头遗址博物馆亮相平潭": "http://ent.people.com.cn/n1/2024/1217/c1012-40383581.html",
+ "青海西宁:打造书香城市": "http://ent.people.com.cn/n1/2024/1217/c1012-40383595.html",
+ "体育大看台 | 什么是垂直马拉松?": "http://ent.people.com.cn/n1/2024/1217/c1012-40383468.html",
+ "“2024年线上骑行嘉年华”启动": "http://ent.people.com.cn/n1/2024/1217/c1012-40383552.html",
+ "举重世锦赛李闫夺得女子87公斤以上级三金": "http://ent.people.com.cn/n1/2024/1217/c1012-40383557.html",
+ "中国小将雷佩凡首夺斯诺克排名赛冠军": "http://ent.people.com.cn/n1/2024/1217/c1012-40383556.html",
+ "布鲁克林篮网:崔永熙因伤病原因离队": "http://ent.people.com.cn/n1/2024/1217/c1012-40383549.html",
+ "全国桥牌通讯赛全年赛事落幕": "http://ent.people.com.cn/n1/2024/1217/c1012-40383561.html",
+ "深圳龙华:客家古村焕新生": "http://ent.people.com.cn/n1/2024/1217/c1012-40383601.html",
+ "文化中国行": "http://ent.people.com.cn/GB/458447/458829/index.html",
+ "文艺星开讲": "http://culture.people.com.cn/GB/430418/index.html",
+ "滇南有灵草 名曰灯盏花": "http://health.people.com.cn/n1/2024/1217/c14739-40383638.html",
+ "健康": "http://health.people.com.cn/GB/415859/index.html",
+ "免费场馆加量 健康生活加码": "http://health.people.com.cn/n1/2024/1217/c14739-40383624.html",
+ "在中华饮食文化中品味健康之道": "http://health.people.com.cn/n1/2024/1217/c14739-40383639.html",
+ "新版目录将职业病调整为12大类135种": "http://health.people.com.cn/n1/2024/1217/c14739-40383690.html",
+ "落实防控指南 密集场所如何有效防控诺如病毒?": "http://health.people.com.cn/n1/2024/1217/c14739-40383733.html",
+ "防治心肌纤维化有了新途径": "http://health.people.com.cn/n1/2024/1217/c14739-40383717.html",
+ "[详情]": "http://www.people.com.cn/GB/50142/420117/420317/index.html",
+ "人民日报社社会责任报告(2022年度)": "http://gongyi.people.com.cn/n1/2023/0531/c151132-40003160.html",
+ "《人民日报社论集(2017.10—2023.03)》出版发行": "http://media.people.com.cn/n1/2023/0504/c14677-32677659.html",
+ "人民网": "http://www.people.com.cn/GB/50142/420117/index.html",
+ "学习贯彻习近平新时代中国特色社会主义思想主题教育官网正式上线": "http://ztjy.people.cn/n1/2023/0422/c457340-32670511.html",
+ "“跟着总书记学党史数据库”正式上线": "http://cpc.people.com.cn/n1/2022/0720/c64387-32480412.html",
+ "天津": "http://tj.people.com.cn/ ",
+ "地方频道人员名单": "http://unn.people.com.cn/GB/422044/index.html",
+ "日本": "http://japan.people.com.cn/",
+ "美国": "http://usa.people.com.cn/",
+ "英国": "http://uk.people.com.cn/",
+ "俄罗斯": "http://ru.people.com.cn/",
+ "韩国": "http://korea.people.com.cn/",
+ "澳新": "http://australia.people.com.cn/",
+ "网站地图": "http://www.people.com.cn/GB/138812/index.html",
+ "中央纪委国家监委": "http://www.ccdi.gov.cn/",
+ "统战部": "http://www.zytzb.gov.cn/",
+ "中联部": "http://www.idcpc.org.cn/",
+ "中央政法委": "http://www.chinapeace.gov.cn/",
+ "中央台办": "http://www.gwytb.gov.cn/",
+ "中央编办": "http://www.scopsr.gov.cn/",
+ "中央党校": "https://www.ccps.gov.cn/",
+ "中央党史和文献研究院": "https://www.dswxyjy.org.cn/",
+ "全国人大": "http://www.npc.gov.cn/",
+ "全国政协": "http://www.cppcc.gov.cn/",
+ "中国政府网": "http://www.gov.cn/",
+ "国家广电总局": "http://www.nrta.gov.cn/",
+ "国务院参事室": "http://www.counsellor.gov.cn/",
+ "中国记协": "http://www.zgjx.cn/",
+ "国新办": "http://www.scio.gov.cn/",
+ "中国网信网": "http://www.cac.gov.cn/",
+ "中国文明网": "http://www.wenming.cn/",
+ "新华网": "http://www.xinhuanet.com/",
+ "央视网": "http://www.cctv.com/",
+ "光明网": "http://www.gmw.cn/",
+ "中国经济网": "http://www.ce.cn/",
+ "中国日报网": "http://www.chinadaily.com.cn/",
+ "中国新闻网": "http://www.chinanews.com/",
+ "中国网": "http://www.china.com.cn/",
+ "中国青年网": "http://www.youth.cn/",
+ "中青在线": "http://www.cyol.com/",
+ "求是网": "http://www.qstheory.cn/",
+ "法治网": "http://www.legaldaily.com.cn/",
+ "中工网": "http://www.workercn.cn/",
+ "央广网": "http://www.cnr.cn/",
+ "国际在线": "http://www.cri.cn/",
+ "中国军网": "http://www.chinamil.com.cn/",
+ "中国台湾网": "http://www.taiwan.cn/",
+ "中国西藏网": "http://www.tibet.cn/",
+ "未来网": "http://www.k618.cn/",
+ "千龙网": "http://www.qianlong.com/",
+ "华龙网": "http://www.cqnews.net/",
+ "齐鲁网": "http://www.iqilu.com/",
+ "红网": "http://www.rednet.cn/",
+ "天山网": "http://www.ts.cn/",
+ "荆楚网": "http://www.cnhubei.com/",
+ "文汇网": "http://www.wenweipo.com/",
+ "北方网": "http://www.enorth.com.cn/",
+ "南方网": "http://www.southcn.com/",
+ "中国残联": "http://www.cdpf.org.cn/",
+ "中国文联": "https://cflac.org.cn/zgwl/",
+ "中国作家网": "http://www.chinawriter.com.cn/",
+ "中国民主促进会": "http://www.mj.org.cn/",
+ "中国志愿服务联合会": "http://www.cvf.org.cn/",
+ "东方网": "http://www.eastday.com/",
+ "人民文旅网": "http://www.rmwl.cn",
+ "中国小康网": "http://www.chinaxiaokang.com/",
+ "党建网": "http://www.dangjian.cn/",
+ "人民日报社概况": "http://www.people.com.cn/GB/1018/22259/index.html",
+ "报社招聘": "http://hr.peopledaily.com.cn/",
+ "招聘英才": "http://job.people.com.cn/",
+ "广告服务": "http://www.people.com.cn/GB/208743/403202/index.html",
+ "合作加盟": "http://www.people.com.cn/GB/208743/403202/403212/index.html",
+ "供稿服务": "http://gonggao.people.com.cn/",
+ "数据服务": "http://data.people.com.cn/",
+ "网站声明": "http://www.people.com.cn/n/2013/1227/c373005-23961344.html",
+ "网站律师": "http://www.people.com.cn/n1/2019/0308/c420117-30965009.html",
+ "信息保护": "http://sso.people.com.cn/resource/html/userInforPro.html",
+ "联系我们": "http://kf.people.com.cn/",
+ "互联网新闻信息服务许可证10120170001": "http://www.people.com.cn/img/2014xuke/2018hlwxw.html",
+ "增值电信业务经营许可证B1-20060139": "http://www.people.com.cn/img/2014xuke/2018zzdxxkz.html",
+ "广播电视节目制作经营许可证(广媒)字第172号": "http://www.people.com.cn/img/2019peopleindex/html/gbds2019.html",
+ "京ICP备12004265号-13": "http://beian.miit.gov.cn",
+ "信息网络传播视听节目许可证0104065": "http://www.people.com.cn/img/2011zzzs/2018xxwlcb.htm",
+ "网络文化经营许可证 京网文[2023]4961-141号": "http://www.people.com.cn/img/2014xuke/2018wlwh.html",
+ "网络出版服务许可证(京)字121号": "http://www.people.com.cn/img/2014xuke/2018wlcb.html",
+ "京ICP证000006号": "http://www.people.com.cn/img/2014xuke/2018icp.html",
+ "京公网安备11000002000008号": "http://www.beian.gov.cn/portal/registerSystemInfo?recordcode=11000002000008"
+}
\ No newline at end of file
diff --git a/test/webpage_samples/task1/922b31/screenshot.jpg b/test/webpage_samples/task1/922b31/screenshot.jpg
new file mode 100644
index 0000000..23b62f2
Binary files /dev/null and b/test/webpage_samples/task1/922b31/screenshot.jpg differ
diff --git a/test/webpage_samples/task1/922b31/text.txt b/test/webpage_samples/task1/922b31/text.txt
new file mode 100644
index 0000000..4013b54
--- /dev/null
+++ b/test/webpage_samples/task1/922b31/text.txt
@@ -0,0 +1,281 @@
+
+首页
+党政
+要闻
+观点
+互动
+可视化
+地方
+民文
+English
+合作网站
+人工智能
+ 人民网客户端网站无障碍举报登录
+当前经济形势怎么看?解读2024年中央经济工作会议精神坚定必胜信心,把各方面积极因素转化为发展实绩深入领会对经济工作的规律性认识迎难而上 坚持干字当头奋发有为
+本固枝荣:坚持和落实“两个毫不动摇”
+中共中央举行纪念乔石同志诞辰100周年座谈会 习近平发表重要讲话
+中国式现代化一个都不能少
+临猗黄河大桥全面通车
+超八成国产牛油果,产自云南这一边境县
+考研冲刺
+河南内黄:“冬闲”人不闲 增收致富忙
+1/7
+习近平的乡土情 擦亮和美乡村幸福底色
+学习·故事|习近平:"老梁,给你带了一份纪念品"
+李强主持国务院第十一次专题学习
+庆祝澳门回归25周年|初心如磐,"莲花卫士"护濠江
+专题
+中国制造向"新"攀登 折射经济韧性活力
+传统产业创新底色足、发展潜力大
+全谷物消费带动节粮减损 提高国民营养健康水平
+活力足动能强 "黄金大通道"效应日益凸显
+让中华体育精神为强国建设提供磅礴能量
+深耕细分赛道,做强做优主业!陈吉宁调研企业
+浦东首创居民自治金项目试点从居民区推向乡村
+要闻·热点
+王毅:元首外交书写恢弘新篇章
+王毅谈2024年中国外交五大亮点
+2024中国正能量网络精品征集展播活动启动
+中国过境免签政策全面放宽优化
+关于第九届全国道德模范候选人的公示
+外交部:欢迎外国朋友继续"种草"中国
+我国加快以标准提升引领原材料工业优化升级
+中美金融工作组举行第七次会议
+稳外贸、稳外资 明年工作这么干
+民政部等三部门联合印发《乡村地名建设指南1.0版》
+事关央企上市公司市值管理!国务院国资委出新规
+中国海警局新闻发言人就菲向非法"坐滩"仁爱礁军舰运补发表谈话
+我国成功发射航天宏图PIESAT-2 09~12星 看点解析
+累计支持建设项目已达116个 智慧农业发展开启"加速度"
+办实事|立交桥下人行道及非机动车道常年积水 江西南昌:已解决
+云南省委原常委、省政府原副省长李石松严重违纪违法被开除党籍和公职
+科学摄入六大营养素 预防呼吸道传染病
+观点·深度
+科技赋能农机 田野拥抱智慧
+
+近年来,围绕建设农业强国目标,中国不断加大农机等科技创新和创新成果应用,农业装备和农业机械化水平实现了跨越式发展,加快向“大中小型兼备、绿色高效智能一体”迈进。目前,全国农作物耕种收综合机械化率达74.3%,农机作业水平不断提升,社会化服务能力显著增强。
+
+中国有信心推动经济持续向好
+
+中国扎实推动高质量发展,将继续引领世界经济提质增效。
+
+金融赋能 托起幸福“夕阳红”
+
+多方联动、众志成城,才能以高质量养老金融为切口,守好养老“钱袋子”,托起幸福“夕阳红”。
+
+马鞍山雨山区:“三中心”落地,“一站式”助企
+
+强化党建引领园区合作共建管理模式,营造“15分钟生活娱乐圈”,为高质量发展积蓄新动能。
+
+“毫厘”间练就“独门绝技”
+
+“福建精度”的背后是以技术创新为“利器”,在一次次尝试中一步步突破极限。
+
+查看更多深度评论
+时习之知行故事一见跟着总书记学党史
+整治形式主义为基层减负工作平台
+党的二十大精神理论大讲堂 党员学习园地
+观察|推动新旧动能平稳接续转换
+坚持用科学方法推动改革行稳致远
+人事|吉林发布省管干部任职前公示公告
+反腐|湖北咸宁:提升纪检监察建议质效
+辽宁专项整治高标准农田建设突出问题
+党史|毛泽东的读书治学之道
+鲁南第二军分区攻坚大王庙
+进入中国共产党新闻网|查看中央文件
+领导留言板·人民建议下载客户端
+汇民智
+解民忧
+30天回复率排行
+聚焦网上群众路线
+回音|山东青岛网友为马拉松建言:扩大赛事规模,提升办赛质量
+
+人民建议|河北网友:优化冀时办APP功能,上线无房证明开具服务
+
+2024网上群众工作大会|“我给两会捎句话”启动
+
+昨日留言6155条 昨日回复3447条
+查看留言我要留言
+人民日报
+人民网记者遍神州>|人民网记者遍全球>
+视频新闻下载客户端
+山东手造丨淄博琉璃灯工:火中的雕塑
+回顾2024年中国军事大场面
+复兴之路|巍巍纪念塔 拳拳追思情
+热点专题
+党的二十大专题学习贯彻三中全会精神总书记的人民情怀时习之新思想引领新时代改革开放奋进强国路 阔步新征程党纪学习教育高质量发展故事汇庆祝澳门回归祖国25周年“行进中国”调研行
+经济 · 科技 社会 · 教育 国际 · 军事 网联中国 文旅 · 体育 健康 · 生活
+经济 · 科技
+35个!2024年国家先进制造业集群名单公布
+
+记者16日从工业和信息化部获悉,2024年国家先进制造业集群名单近日公布,包括成德绵自凉航空航天集群、青烟威船舶与海洋工程装备集群、洛阳现代农机装备集群等35个集群。
+
+对话企业家人民会客厅消费维权
+分享
+开放谈:以创新引领数字贸易高质量发展
+延续回升态势 全年目标有望顺利实现
+这份方案促零售业创新提升
+我国避寒游、冰雪游南北竞相升温
+读懂“川菜热”背后的烟火中国
+电动汽车供电设备强制认证将解决哪些问题和隐患?
+
+市场监管总局近日发布公告,将对电动汽车供电设备实施强制性产品认证(CCC认证)管理。此次纳入的主要包括生活中常见的固定充电桩、移动式充电设施、随车充电设备等。目前在用的供电设备总体情况如何?通过强制认证能够解决哪些问题和隐患?
+
+科技生态
+分享
+喜看“三农”新图景:农业更高效 乡村更美好
+我国成功发射卫星互联网低轨卫星
+新研究揭示人类基因流动复杂历史
+中国核电在运在建规模升至世界第一
+流感高发,如何预防与应对?
+解锁人民网“梦幻灵境”
+“万商万品 万象焕新”百日直播行动
+一吨煤的绿色转型
+社会 · 教育
+司法“精耕细作” “滴灌”乡村田野
+
+辽宁,作为全国13个粮食主产省之一,源源不断地为“中国碗”提供优质“辽宁粮”。产业兴旺、生态宜居、乡风文明、治理有效、生活富裕,一幅乡村振兴新图景正在辽沈沃野徐徐展开。
+
+社会·法治
+分享
+科技赋能农机 田野拥抱智慧
+千年古镇,法庭绘就新“枫”景
+黑龙江:构建“快进快退”破产案件审判机制
+广东东莞二院:法庭与司法分局联手化解租赁纠纷
+业委会换了,电梯更换还能继续履行吗?
+国家大学科技园为科技成果转化搭建重要平台
+
+2024年初,国家大学科技园转由教育部牵头管理,健步走上高质量发展快车道。从“星辰点点”到星罗棋布,大学科技园建设面临着优化重塑、融合发展的全新态势。在科技成果转化的重大使命面前,其发展状况如何,又面临着哪些亟待解决的问题?
+
+教育滚动新闻大学
+分享
+让优质教育资源润泽雪域高原
+体教融合,为振兴三大球强基固本
+农业研学应“研”之有道
+贵阳综合保税区今年以来引才近1400人
+积极构建中国自主的教育学知识体系
+青海西宁:非遗唐卡“画”进高校课堂
+青城山冬景如画
+四川广安:最后冲刺抢收柠檬
+国际 · 军事
+打造惠及世界的“幸福路”
+
+2024年是共建“一带一路”第二个金色十年的开局之年。这一年,中国继续同各方一道,传承丝路精神,促进合作共赢,共建“一带一路”在高质量发展中开拓出造福世界的发展繁荣之路,铺展出构建人类命运共同体的壮美画卷。
+
+国际
+分享
+外国留学生走进重庆北碚,开启“村”游
+联合国防治荒漠化大会上的中国印象
+埃及专家:应对重重挑战 “全球南方”需要中国贡献
+中美合作造福两国,更是大势所趋、世界期待
+汉语培训班为尼泊尔培养240名中文旅游人才
+沙特大力开发天然气资源
+
+沙特阿拉伯国家石油公司(以下简称“沙特阿美”)近日宣布投资250亿美元,用于该国贾富拉天然气田二期扩建项目和国家天然气管网三期扩建工程。沙特阿美总裁兼首席执行官阿明·纳赛尔表示,该公司打算进一步整合和发展天然气业务,以满足不断增长的需求。
+
+国际
+分享
+埃及和约旦领导人呼吁立即在加沙停火
+普京:俄对美国拟部署中程导弹表示担忧
+美国威斯康辛州发生校园枪击案造成2死6伤
+也门胡塞武装称向以色列发射高超音速导弹
+韩国宪法法院要求尹锡悦23日前提交弹劾案答辩
+广东省珠海市大力解决驻军部队难题
+
+“联席会开完不到一周,我们反映的问题就有回音了。”12月3日,广东省珠海市军地联合工作组来到某部营区,实地了解该部进驻该市后面临的练兵备战难题,受到官兵欢迎。据了解,该市建立军地互提需求、互办实事常态化工作机制,每年至少召开2次驻军联席会议了解驻军部队需求。此次联席会议上,驻军部队共反映16项难题,有关事项已在推进解决之中。
+
+军事滚动新闻
+分享
+发挥老兵余热 讲好国防故事
+第76集团军某旅评功评奖坚持公平公正公开
+海军航空大学某大队舰载机陆基起降训练掠影
+新疆军区某综合训练基地科学制订“病号食谱”
+空中加油技术的“前世今生”
+朔尔茨未通过联邦议院信任投票
+圣彼得堡举办马戏主题展
+和平力量相遇深蓝航道
+网联中国
+大河之南 兴起新文旅
+
+黄河,孕育了灿烂的中华文明。地处黄河文化腹心,河南拥有丰富的历史文化资源。深挖宝藏,着力创新,一批黄河文化旅游新创意、新场景、新玩法在大河之南悄然兴起。谋定文旅融合,河南拥抱黄河大IP,让“文化”出圈,赢旅游流量。
+
+分享
+安徽省检察院举行开放日活动 代表委员建言献策
+贵州举行森林防火主题宣传活动
+“简牍学文库”项目启动暨编纂出版座谈会举行
+宁夏:六盘山下冰雪赛事“燃”
+河钢全球首条氢冶金绿色汽车板连铸生产线投产
+老工业基地“上演”新故事
+北京“守夜人”
+“何以中国”的山东故事
+文旅 · 体育
+“没想到中国乡村这么有魅力”
+
+不久前,由国家留学基金委主办、西南大学承办的“感知中国—碚城探秘·乡建寻踪”来华留学生乡村建设教育实践活动在东升村实践基地举办。来自巴基斯坦、津巴布韦、博茨瓦纳等多国来华留学生开启“村”游,体验乡村历史、文化与风土人情。
+
+文化旅游体育
+分享
+赴一场辽金历史文化盛宴
+2025春天,到潮汕奔赴一场英雄之舞
+古蜀文明保护传承二期工程开启
+壳丘头遗址博物馆亮相平潭
+青海西宁:打造书香城市
+体育大看台 | 什么是垂直马拉松?
+
+冬日花城,天气晴朗。近千名海内外选手来到广东省广州市的周大福金融中心,参加2024国际垂直马拉松总决赛广州站的比赛。什么是垂直马拉松?简单来说就是“比赛爬楼梯”,参赛选手又被称为“梯客”。
+
+文化旅游体育
+分享
+“2024年线上骑行嘉年华”启动
+举重世锦赛李闫夺得女子87公斤以上级三金
+中国小将雷佩凡首夺斯诺克排名赛冠军
+布鲁克林篮网:崔永熙因伤病原因离队
+全国桥牌通讯赛全年赛事落幕
+深圳龙华:客家古村焕新生
+文化中国行
+文艺星开讲
+健康 · 生活下载客户端
+滇南有灵草 名曰灯盏花
+
+灯盏花,又名灯盏细辛,因花似灯盏、根似细辛而得名,有着“滇南灵草”的美誉。灯盏花最早明确记载于明代医药家兰茂所著的《滇南本草》,是菊科飞蓬属的一年生草本植物,主要分布于我国西南地区,尤以云南灯盏花药材资源最为丰富,产量占全国资源总量95%,获国家地理产品标志保护。
+
+健康“人民消费”中消协教育课堂
+分享
+免费场馆加量 健康生活加码
+在中华饮食文化中品味健康之道
+新版目录将职业病调整为12大类135种
+落实防控指南 密集场所如何有效防控诺如病毒?
+防治心肌纤维化有了新途径
+人民日报
+2022年12月8日,由人民日报社主办的2022中国品牌论坛在北京举行。本次论坛以“推动中国品牌建设高质量发展”为主题,政府主管部门代表、企业负责人、专家学者齐聚一堂,开展深入研讨交流,为助推中国品牌建设汇聚智慧力量。[详情]
+人民日报社社会责任报告(2022年度)
+《人民日报社论集(2017.10—2023.03)》出版发行
+人民网
+人民网是《人民日报》建设的大型网上信息交互平台,是人民日报社控股的传媒文化上市公司,是国际互联网上最大的综合性网络媒体之一。1997年1月1日,人民网正式上线。2006年7月1日,中共中央批准人民网承办的“中国共产党新闻网”上线,成为宣传和介绍中国共产党思想、理论、政策、信息的权威网站。[详情]
+学习贯彻习近平新时代中国特色社会主义思想主题教育官网正式上线
+“跟着总书记学党史数据库”正式上线
+旗下
+国内分公司
+北京 天津 河北 山西 内蒙古 辽宁 吉林 黑龙江 上海 江苏 浙江 安徽 福建 江西 山东 河南 湖北 湖南 广东 广西 海南 重庆 四川 贵州 云南 西藏 陕西 甘肃 青海 宁夏 新疆 深圳 雄安
+地方频道人员名单
+国别频道
+日本 美国 英国 俄罗斯 韩国 澳新
+网站地图
+友情链接
+
+中央纪委国家监委统战部中联部中央政法委中央台办中央编办中央和国家机关工委中央党校中央党史和文献研究院全国人大全国政协中国政府网国家广电总局国务院参事室中国记协国新办中国网信网中国文明网新华网央视网光明网中国经济网中国日报网中国新闻网中国网中国青年网中青在线求是网法治网中工网央广网国际在线中国军网中国台湾网中国西藏网未来网千龙网华龙网齐鲁网红网天山网荆楚网文汇网北方网南方网中国残联中国文联中国作家网中国民主促进会中国志愿服务联合会东方网人民文旅网中国小康网党建网
+
+人民日报社概况| 关于人民网| 报社招聘| 招聘英才| 广告服务| 合作加盟| 供稿服务| 数据服务| 网站声明| 网站律师| 信息保护| 联系我们
+
+人民日报违法和不良信息举报电话:010-65363263 举报邮箱:jubao@people.cn
+
+人民网服务邮箱:kf@people.cn 违法和不良信息举报电话:010-65363636 举报邮箱:rmwjubao@people.cn
+
+互联网新闻信息服务许可证10120170001 | 增值电信业务经营许可证B1-20060139 | 广播电视节目制作经营许可证(广媒)字第172号 | 京ICP备12004265号-13
+
+信息网络传播视听节目许可证0104065 | 网络文化经营许可证 京网文[2023]4961-141号 | 网络出版服务许可证(京)字121号 | 京ICP证000006号 | 京公网安备11000002000008号
+
+人 民 网 股 份 有 限 公 司 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用
+Copyright © 1997-2024 by www.people.com.cn. all rights reserved
+
+
\ No newline at end of file
diff --git a/test/webpage_samples/task1/ee88f6/link_dict.json b/test/webpage_samples/task1/ee88f6/link_dict.json
new file mode 100644
index 0000000..9e26dfe
--- /dev/null
+++ b/test/webpage_samples/task1/ee88f6/link_dict.json
@@ -0,0 +1 @@
+{}
\ No newline at end of file
diff --git a/test/webpage_samples/task1/ee88f6/screenshot.jpg b/test/webpage_samples/task1/ee88f6/screenshot.jpg
new file mode 100644
index 0000000..ef498d4
Binary files /dev/null and b/test/webpage_samples/task1/ee88f6/screenshot.jpg differ
diff --git a/test/webpage_samples/task1/ee88f6/text.txt b/test/webpage_samples/task1/ee88f6/text.txt
new file mode 100644
index 0000000..60faf71
--- /dev/null
+++ b/test/webpage_samples/task1/ee88f6/text.txt
@@ -0,0 +1,111 @@
+【传承红色基因】七旬老兵和他的《新兵日记》——访复元坊居民区党员志愿者、退役军人刘玉鹏
+芷江新视野
+ 2024年12月16日 17:27 上海
+
+七旬老兵和他的《新兵日记》
+
+传承红色基因
+
+赓续红色血脉
+
+1969年3月12日,高中毕业的刘玉鹏穿上“65式”新军服(空军军装为上绿下蓝),佩戴大红花,打起背包,告别父母,离开家乡。天空久违地飘起了小雪花。二十岁不到的刘玉鹏在新兵连集训结束后被分到机务中队,跟着队伍在静安区体育馆集合,踏上南下的火车,奔赴祖国的南疆大门——广东遂溪。
+
+这个位于雷州半岛上的小县城,面积仅2000平方公里,刘玉鹏在地图上认真搜寻了好一会儿才找到具体位置。未知的军旅生涯、陌生的人文地理,让坐在飞驰的列车上的这位年轻人,内心不由得感到紧张、期待和忐忑。
+
+五十多年后,再次提及自己当年入伍时的情形,刘玉鹏依然记忆犹新。与之相随的,还有一本珍藏了50年,内页泛黄的日记本,“这是我新兵入伍第一年的日记,写了很多琐碎的小事及感想,但对我日后的工作帮助极大”。
+
+刘玉鹏的《新兵日记》(封面)
+
+日记从1969年4月17日开始。
+
+
+刘玉鹏的《新兵日记》(部分)
+
+
+
+
+
+
+
+刘玉鹏
+
+进场、放飞,初识战鹰
+
+飞云之上,一架架战鹰正呼啸而过;苍穹之下,有一群人在等候战鹰凯旋归来。他们就是铁翼下的守护者——机务兵。机务兵是什么样的一个群体?从刘玉鹏的日记里,我们或许可以看到一名普通机务兵的一些日常。
+
+“参加了几次飞训,发生了几次故障,使我懂得了维护飞机的重要意义。”刘玉鹏写道。对飞机的检查容不得半点差错,必须用极端负责的匠人精神,坚决守护战鹰和战友的安全。
+
+
+面对战机,背对人群,负责维护战机,作为一名机务兵,他们是一群不上蓝天的空军战士。每天清晨,登车进场、布置任务、明确分工,冲向战位;取下机身上盖着的蒙布,取堵盖、上座舱……解刀、扳手、抹布是他们手中的“武器”,拧好每一颗螺丝,擦好每一块蒙皮,消除每一起隐患,把好每一道关口,一切只为战鹰顺利起飞。
+
+刘玉鹏分到机务中队的第二天,就跟着老同志去机场实地看起动车和飞机电瓶。“以后,他们就是你们经常要打交道的设备。”老同志告诉刘玉鹏,一星期后,他会和特设师一起带领新兵们换飞机电瓶,并进行飞行后检查。
+
+十天后,刘玉鹏第一次参加飞行保障任务,并使用起动车设备。同年六月中旬,刘玉鹏开始定期承担更换电瓶工作。
+
+机务人员的安全观念十分重要。每次发现飞机故障,刘玉鹏都会跟在老兵后面,一起加班排除故障,坚决把故障隐患留在地面,“机务工作让我养成了诸多好习惯,使我一生受益”。
+
+
+
+
+白手套慢慢变成了“黑手套”
+
+机务工作必须要认真仔细,绝对不能有丝毫的马虎之处。
+
+翻开1969年4月19日的日记,刘玉鹏写道:“在机房上要极端认真,看启动车电压表我一没注意,停了也不知。(今后)对待工作一定要做好,能自己干的事一定要完成。”
+
+每次换好电瓶后,刘玉鹏总想着总电门有沒有关闭,一定要再三确认才肯离开。“当兵就是为了保卫祖国,必须时刻保持高度警惕。”
+
+当时,部队经常进行战备演习。“一次演习,我刚好在兄弟中队的洗漱间洗澡,不知紧急集合上机场准备飞机。当我洗完澡才知道搞演习,心想演习快结束了,去了也没用。然而,有一个战友和我情况一样,恁是从营房跑步到机场。这件事情让我感到很是惭愧,(决心)从错误中吸取教训。后来,我在以后的战斗警戒值班中,时刻保持高度警惕,努力完成任务。”
+
+机务工作是按条令条例检查维护飞机,关系到国家财产和飞行员的生命安全,必须一步一个脚印,认真过细地做好机务工作。“对战斗胜利负责、对战友生命负责、对国家财产负责”的“三负责”精神是空军优良传统的重要组成部分。1964年,夏北浩总结出以“三三四四两化三要”为主要内容的“夏北浩检查法”,成为空军航空机务战线的一面旗帜。
+
+所谓“三三四四”是指“三个负责”(对战斗胜利负责;对战友生命负责;对国家财产负责)、“三想”(工作前想上级的规定和要求;工作中想方法和步骤;工作后想有没有遗漏)、“四到”(该看到的看到;该摸到的摸到;该嗅到的嗅到;该听到的听到)、“四个一样”(领导不在场与在场一个样;冷天、热天与一般气候条件一个样;飞机没有故障与有故障一个样;飞行结束得晚与结束得早一个样)。“两化”是指检查飞机路线化,操作程序化。“三要”是指要积累经验摸规律,掌握渐变防突变;要做好经常性的维护保养工作;要对飞机了如指掌。
+
+60年后,在第15届珠海航展的中国空军静态展区,“夏北浩精神”五个字与歼-20战斗机悄然同框。
+
+“要有高度的组织纪律性……今后,凡是不对的事情坚决不做。”“提前拔了起动车插头,但没有告诉机械师,令其误以为起动完成。自己没有注意到工作的细节,此种情形(别人)已有过,却没有把他们的教训引以为戒,以后要加强清醒的头脑,要向人民负责。”这是在1970年1月21日至2月11日期间,刘玉鹏写下的劝诫自己的话语。
+
+虽从未随战机翱翔蓝天,但他们用匠心托举战机升空。从白手套慢慢变成了“黑手套”,刘玉鹏靠着一股韧劲,十年如一日地驻守在祖国的边疆。
+
+
+
+
+信仰,成就青春的底色
+
+“1970年1月31日,支部大会通过自己加入中国共产党。”这一行字,刘玉鹏写得格外用心,字体也明显大了许多。
+
+一下连队,刘玉鹏就立即投入到紧张的政治和军事技能的学习中去。开展谈心活动是部队思想政治工作传统行之有效方法。刚开始,刘玉鹏学习《为人民服务》《愚公移山》《纪念白求恩》“老三篇”文章,在劳动中认真磨炼自己,在生活中助人为乐。
+
+“刚到生产队锄草,我干了一会就干不动了,当看到比我年龄小的新战士比我干得欢、干得多,我就坚持将活干到结束。”“下半年,在部队生产队劳动时,除了完成任务外,还利用业务时间主动为菜园浇水施肥。”“在五月份内务值班时,我不怕脏不怕累,打扫洗涮室内和厕所。”“在农村一天只能吃三顿地瓜稀饭。”“每天晚上,我和战友都要去几百米外的地方挑井水,来回三四趟。”“头几次参加野营拉练,很不适应,脚上起了三四个泡。心里想着必须坚持完成任务,不能掉队。”……
+
+这些话语有感而发,真真切切,令人读来倍感亲切与温暖。日记里的故事,是一名新兵生活的缩影,也是一代人逝去的青春岁月。
+
+“我们新兵,每月六元津贴。分队配备我们新兵手电,由于数量少,(不够每个人使用)我毫不犹豫让给别的战友。”“自己为二分队垫付了电影款。”“当得知家乡一位邻居老人有困难,我主动汇款帮助。”“(开展)两周专业理论学习。我与河南籍三位战友(分在)一个小组,由于他们过去没有学过电工知识,我除了自己学好外,还不厌其烦地为他们讲解。有时嗓子讲得燥干,仍耐心坚持讲下去。”……
+
+部队是一所大学校,大熔炉,是铸就年轻人百炼成钢、走向社会坦途的好地方。“我更要高标准,严格要求自己,经常向入党联系人汇报思想,找老同志谈心,虚心向他们学习,征求他们对自己的意见和看法。”
+
+积极要求进步的刘玉鹏,在入伍一年后,顺利入党,成为一名光荣的共产党员。
+
+
+
+
+过去的故事
+
+刘玉鹏(年轻)
+
+刘玉鹏在机场
+
+刘玉鹏和歼-6战斗机
+
+刘玉鹏和战友
+
+向下滑动查看所有照片
+
+
+
+
+
+
+
+供稿:党群办、复元坊居民区
+来源:社区晨报
\ No newline at end of file
diff --git a/test/webpage_samples/task1/f25bd2/link_dict.json b/test/webpage_samples/task1/f25bd2/link_dict.json
new file mode 100644
index 0000000..4381a98
--- /dev/null
+++ b/test/webpage_samples/task1/f25bd2/link_dict.json
@@ -0,0 +1,3 @@
+{
+ "习近平:必须坚持守正创新": "https://mp.weixin.qq.com/s?__biz=MzA3NjEyNDIyMg==&mid=2656438569&idx=1&sn=521c4b87de39443e79f085c9c38ab9e5&scene=21#wechat_redirect"
+}
\ No newline at end of file
diff --git a/test/webpage_samples/task1/f25bd2/screenshot.jpg b/test/webpage_samples/task1/f25bd2/screenshot.jpg
new file mode 100644
index 0000000..922d613
Binary files /dev/null and b/test/webpage_samples/task1/f25bd2/screenshot.jpg differ
diff --git a/test/webpage_samples/task1/f25bd2/text.txt b/test/webpage_samples/task1/f25bd2/text.txt
new file mode 100644
index 0000000..ae61fd9
--- /dev/null
+++ b/test/webpage_samples/task1/f25bd2/text.txt
@@ -0,0 +1,143 @@
+以守正创新把握时代引领时代
+党建汇
+ 2024年12月11日 22:17 上海
+
+
+
+“守正创新是进一步全面深化改革必须牢牢把握、始终坚守的重大原则”。
+
+金秋十月,省部级主要领导干部学习贯彻党的二十届三中全会精神专题研讨班在中央党校(国家行政学院)开班,习近平总书记在开班式上发表重要讲话,把守正创新提升到进一步全面深化改革必须牢牢把握、始终坚守的重大原则高度作出深刻阐释。
+
+中华民族是守正创新的民族,守正创新是中国特色社会主义新时代的鲜明气象,是习近平新时代中国特色社会主义思想的显著标识。党的十八大以来,习近平总书记围绕坚持守正创新作出一系列重要论述和重大部署,深刻回答了什么是守正创新、为什么要守正创新、怎样守正创新等重大理论和实践问题,为新时代党和国家事业取得历史性成就、发生历史性变革提供了科学指导和重要遵循。
+
+《必须坚持守正创新》(原文链接:习近平:必须坚持守正创新)一文,摘自习近平总书记2013年1月至2024年8月期间的报告、讲话等重要文献,集中反映了总书记关于坚持守正创新的一系列新思想、新观点、新论断、新要求,具有很强的政治性、理论性、针对性、指导性。要把深入学习领会这篇重要文章精神,同深入学习贯彻习近平新时代中国特色社会主义思想结合起来,同深入学习贯彻党的二十届三中全会精神结合起来,坚持守正创新,坚定改革信心,更好凝心聚力推动改革行稳致远,为中国式现代化提供强大动力和制度保障。
+
+
+
+
+我们党不断从胜利走向新的胜利的重要思想方法
+
+
+
+
+“通过!”
+
+2024年7月18日下午,北京人民大会堂,党的二十届三中全会第二次全体会议在此举行,郑重表决《中共中央关于进一步全面深化改革、推进中国式现代化的决定》。随着习近平总书记的庄严宣布,全场响起热烈掌声。
+
+随后,习近平总书记发表重要讲话,对贯彻落实全会精神提出明确要求,强调“坚持守正创新,既要有道不变、志不改的强大定力,坚持四项基本原则、坚定‘四个自信’不动摇,又要有敢创新、勇攻坚的锐气胆魄,推动改革不断取得新突破”。《必须坚持守正创新》这篇重要文章收录了总书记的这一重要论述。
+
+我们信仰的是科学真理,走的是人间正道,从事的是前无古人的伟大事业,坚持守正创新是党和人民事业从胜利走向胜利的根本保证。守正,就要坚守真理、坚守正道,坚持党的全面领导、坚持马克思主义、坚持中国特色社会主义、坚持人民民主专政等根本的东西不动摇。创新,就要勇于探索、开辟新境,永不僵化、永不停滞,敢于说前人没有说过的新话,敢于干前人没有干过的事情,以新的理论指导新的实践。守正与创新相辅相成,体现了“变”与“不变”、继承与发展、原则性与创造性的辩证统一。
+
+坚持守正创新,既彰显了马克思主义世界观和方法论的特质,又继承发展了中华民族几千年来恪守正道、革故鼎新的文化传统和守正不守旧、尊古不复古的进取精神,与我们党一贯坚持的解放思想、实事求是、与时俱进、求真务实的品格相贯通,是贯彻党的思想路线的内在要求。
+
+
+
+
+新中国成立75年来,中国共产党团结带领全国各族人民,创造了经济快速发展和社会长期稳定两大奇迹,中华民族伟大复兴进入了不可逆转的历史进程,全党全国各族人民“四个自信”明显增强、精神面貌更加奋发昂扬。2024年9月29日,中华人民共和国国家勋章和国家荣誉称号颁授仪式在北京人民大会堂金色大厅隆重举行。图为礼兵护送国家勋章和国家荣誉称号奖章入场。 新华社记者 岳月伟/摄
+
+
+
+
+
+
+
+回望党的奋斗历程,我们党在不同历史时期始终坚持解放思想、实事求是、守正创新,勇于推进实践基础上的理论创新,在理论创新和实践创新的良性互动中不断赢得新胜利、开创新局面。新民主主义革命时期,党把马克思列宁主义基本原理同中国具体实际相结合,对经过艰苦探索、付出巨大牺牲积累的一系列独创性经验作出理论概括,创立了毛泽东思想,建立了新中国,中国发展从此开启了新纪元。社会主义革命和建设时期,党结合新的实际丰富和发展毛泽东思想,提出关于社会主义建设的一系列重要思想,领导人民实现了中华民族有史以来最为广泛而深刻的社会变革,实现了大步迈进社会主义社会的伟大飞跃。改革开放和社会主义现代化建设新时期,党从新的实践和时代特征出发坚持和发展马克思主义,作出实行改革开放的历史性决策,成功开创了中国特色社会主义,实现了经济总量跃居世界第二的历史性突破,中国大踏步赶上了时代。
+
+新时代,以习近平同志为核心的党中央始终坚持守正创新,全面贯彻党的基本理论、基本路线、基本方略,在立场、方向、原则、道路等根本性问题上旗帜鲜明、毫不含糊,着力正本清源、固本培元,高扬理想信念的旗帜、马克思主义的旗帜、中国特色社会主义的旗帜,确保了党不变质、不变色、不变味。同时,面对快速变化的世界和中国,我们党坚持解放思想、立破并举,准确识变、科学应变、主动求变,以巨大勇气和魄力推进各方面改革创新,推动党和国家事业取得历史性成就、发生历史性变革,中国共产党的面貌、中国人民的面貌、社会主义中国的面貌、中华民族的面貌焕然一新。
+
+一路走来,党之所以能够战胜一个又一个艰难险阻、夺取一个又一个伟大胜利、创造一个又一个人间奇迹,一个重要原因在于始终坚持守正创新。
+
+
+
+
+新时代的鲜明气象
+
+
+
+
+
+
+
+百年大党,正道沧桑。在我们党百余年的历史征程上,每一个历史时期都有自己的鲜明气象。
+
+2021年7月1日,北京天安门城楼,习近平总书记在庆祝中国共产党成立100周年大会上发表重要讲话,用32个字分别概括了我们党4个历史时期的鲜明气象,用“浴血奋战、百折不挠”概括新民主主义革命时期,用“自力更生、发愤图强”概括社会主义革命和建设时期,用“解放思想、锐意进取”概括改革开放和社会主义现代化建设新时期,用“自信自强、守正创新”概括新时代。
+
+守正创新是新时代的鲜明气象,也是我们党在新时代治国理政的重要思想方法。党的二十大概括阐述了习近平新时代中国特色社会主义思想的世界观、方法论和贯穿其中的立场观点方法,“必须坚持守正创新”是“六个必须坚持”之一;党的二十届三中全会明确把“坚持守正创新”作为进一步全面深化改革必须贯彻的“六个坚持”原则之一。
+
+党的十八大以来,中国特色社会主义进入新时代。党面临的主要任务是,实现第一个百年奋斗目标,开启实现第二个百年奋斗目标新征程,朝着实现中华民族伟大复兴的宏伟目标继续前进。面对世界百年未有之大变局,面对国情党情的深刻复杂变化,面对影响党长期执政、国家长治久安、人民幸福安康的突出矛盾和问题,守正创新比以往任何一个时期都更为紧迫、更为繁重。习近平总书记在团结带领全党全国各族人民进行具有许多新的历史特点的伟大斗争中,紧紧围绕坚持守正创新不断深入思索,作出一系列重要论述,不断丰富和发展坚持守正创新的思想内涵,彰显了强烈的问题意识和鲜明的实践导向。
+
+——关于什么是守正创新,习近平总书记强调,“守正和创新是辩证统一的,只有守正才能保证创新始终沿着正确方向前进,只有持续创新才能更好地守正”。在“守什么正”上,总书记强调,“坚持党的全面领导、坚持马克思主义、坚持中国特色社会主义、坚持人民民主专政,以促进社会公平正义、增进人民福祉为出发点和落脚点,这些都是管根本、管方向、管长远的,体现党的性质和宗旨,符合我国国情,符合人民根本利益,任何时候任何情况下都不能有丝毫动摇”;在“创什么新”上,总书记强调,“世界每时每刻都在发生变化,中国也每时每刻都在发生变化,我们必须在理论上跟上时代,不断认识规律,不断推进理论创新、实践创新、制度创新、文化创新以及其他各方面创新”。
+
+
+
+
+党的十八大以来,以习近平同志为核心的党中央高度重视科技创新,深入实施创新驱动发展战略,着力推动高质量发展,我国科技实力从量的积累迈向质的飞跃、从点的突破迈向系统能力提升,为经济社会平稳健康可持续发展提供了战略支撑。图为2024年10月16日拍摄的成都科创生态岛(无人机全景照片)。 新华社记者 刘坤/摄
+
+
+
+
+
+
+
+——关于为什么要守正创新,习近平总书记强调,“我提出守正创新,就是强调既不走封闭僵化的老路,也不走改旗易帜的邪路”,“无论时代如何发展,我们都要激发守正创新、奋勇向前的民族智慧”。总书记强调,“我们要永远记住,我们所进行的一切完善和改进,都是在既定方向上的继续前进,而不是改变方向,更不是要丢掉我们党、国家、人民安身立命的根本”;“要学马列主义,但马列主义经典著作不能给出解决现实问题的现成答案,只能运用它的原理、立场、观点、方法,通过自己的摸索、咀嚼、创新来提出答案。西方的东西要借鉴,但不能完全吃它这碗饭,不能全盘接受”;“我们搞的事业,我们是先行者、探索者,没有人给我们提供可以采用拿来主义态度的经验,必须通过理论上不断探索、不断突破来指导实践,并用实践中摸索到的规律来升华我们的理论”。
+
+——关于怎样守正创新,习近平总书记强调,“要坚持守正和创新相统一”,“守正就不能偏离马克思主义、社会主义,但不是刻舟求剑,还要往前发展、与时俱进,否则就是僵化的、陈旧的、过时的”;“理论创新必须讲新话,但不能丢了老祖宗,数典忘祖就等于割断了魂脉和根脉,最终会犯失去魂脉和根脉的颠覆性错误”。总书记强调,“要准确把握时代大势,勇于站在人类发展前沿,聆听人民心声,回应现实需要,坚持解放思想、实事求是、守正创新,更好把坚持马克思主义和发展马克思主义统一起来,坚持用马克思主义之‘矢’去射新时代中国之‘的’”;“我们的改革是有方向、有原则的”,“要坚持继续完善和发展中国特色社会主义制度、推进国家治理体系和治理能力现代化的改革总目标,始终朝着总目标指引的方向前进,该改的坚决改,不该改的不改。要顺应时代发展新趋势、实践发展新要求、人民群众新期待,突出经济体制改革这个重点,全面协调推进各方面改革,大力推进理论创新、实践创新、制度创新、文化创新以及其他各方面创新”。
+
+习近平总书记的一系列重要论述,深刻回答了事关坚持守正创新的一系列重大理论和实践问题,是对我们党历史经验特别是新时代伟大变革宝贵经验的科学总结,为新时代治国理政提供了重要指导,为推进强国建设、民族复兴伟业提供了重要遵循。
+
+正是在新时代守正创新的伟大实践中,以习近平同志为主要代表的中国共产党人,坚持把马克思主义基本原理同中国具体实际相结合、同中华优秀传统文化相结合,科学回答了新时代坚持和发展什么样的中国特色社会主义、怎样坚持和发展中国特色社会主义等重大时代课题,创立了习近平新时代中国特色社会主义思想。这一重要思想,既坚持了老祖宗、又讲了许多新话,以全新的视野深化了对共产党执政规律、社会主义建设规律、人类社会发展规律的认识,为发展马克思主义作出了原创性贡献,实现了马克思主义中国化时代化新的飞跃。
+
+实践已经证明并将继续证明,新时代党和国家事业之所以取得历史性成就、发生历史性变革,离不开对守正创新的坚持和坚守;不断开创党和国家事业发展新局面,必须始终坚持守正创新。正如习近平总书记在《必须坚持守正创新》这篇重要文章中反复强调的,“守正才能不迷失方向、不犯颠覆性错误,创新才能把握时代、引领时代”。新征程上,我们必须牢牢坚持守正创新不动摇,不断开创马克思主义中国化时代化新境界,不断开创治国理政新境界。
+
+
+
+
+在继承中发展、在守正中创新
+
+
+
+
+
+
+
+事业越伟大,越艰难险阻,越需要守正创新。
+
+中国式现代化的实践探索和不断推进,就是一个在继承中发展、在守正中创新的历史进程。党的二十大确立了全面建成社会主义现代化强国、实现第二个百年奋斗目标,以中国式现代化全面推进中华民族伟大复兴的中心任务,对推进中国式现代化作出战略部署。党的二十届三中全会,在新的历史起点上对进一步全面深化改革、推进中国式现代化作出了总动员、总部署。
+
+道阻且长,行则将至。新征程是充满光荣和梦想的远征,是一项伟大而艰巨的事业,必然充满艰辛、充满未知、充满风险挑战。前进道路上,必须始终坚持守正创新,毫不动摇坚持和发展中国特色社会主义,紧跟时代步伐,顺应实践发展,突出问题导向,不断推进理论创新、实践创新、制度创新、文化创新以及其他各方面创新。在《必须坚持守正创新》这篇重要文章中,习近平总书记对守正创新提出了一系列明确要求。
+
+
+
+
+新时代以来,在习近平生态文明思想科学指引下,生态文明建设从理论到实践都发生了历史性、转折性、全局性变化,生态文明体制改革纵深推进,生态文明制度体系基本形成,生态环境质量持续改善。陕西省安康市多年来通过建立“河湖长制+志愿者”护河机制,扎实推进汉江水质保护工作,使汉江出境断面水质稳定保持国家地表水Ⅱ类标准。图为2024年11月2日拍摄的安康汉江瀛湖库区景色(无人机照片)。 新华社记者 邵瑞/摄
+
+
+
+
+
+
+
+继续推进实践基础上的理论创新。时代是思想之母,实践是理论之源。实践没有止境,理论创新也没有止境。不断谱写马克思主义中国化时代化新篇章,是当代中国共产党人的庄严历史责任。推进马克思主义中国化时代化,必须始终坚守理论创新的魂和根,决不能抛弃马克思主义这个魂脉,决不能抛弃中华优秀传统文化这个根脉。习近平总书记深刻指出,坚守好这个魂和根,是理论创新的基础和前提,理论创新也是为了更好坚守这个魂和根。总书记明确要求,“必须坚持马克思主义这个立党立国、兴党兴国之本不动摇,坚持植根本国、本民族历史文化沃土发展马克思主义不停步”,“有效把马克思主义思想精髓同中华优秀传统文化精华贯通起来,聚变为新的理论优势,不断攀登新的思想高峰”。
+
+使中国特色社会主义永远充满蓬勃生机活力。中国特色社会主义是在改革开放40多年的伟大实践中得来的,是在新中国成立70多年的持续探索中得来的,是在我们党领导人民进行伟大社会革命100多年的实践中得来的,是在近代以来中华民族由衰到盛180多年的历史进程中得来的,是在世界社会主义500多年波澜壮阔的发展历程中得来的,是在对中华文明5000多年的传承发展中得来的,是历史的选择、人民的选择,必须倍加珍惜、长期坚持、不断发展。习近平总书记鲜明强调,坚持守正创新就要坚持中国特色社会主义不动摇、坚定“四个自信”不动摇;明确指出,“我们强调坚定道路自信、理论自信、制度自信、文化自信,不是说就固步自封、不思进取了,我们必须不断有所发现、有所发明、有所创造、有所前进,使中国特色社会主义永远充满蓬勃生机活力”。
+
+确保中国式现代化的正确方向。中国式现代化是我们党领导全国各族人民在长期探索和实践中历经千辛万苦、付出巨大代价取得的重大成果,是强国建设、民族复兴的唯一正确道路。推进中国式现代化是一个系统工程、长期任务,需要统筹兼顾、系统谋划、整体推进,正确处理好守正与创新等一系列重大关系。习近平总书记强调,“在推进中国式现代化新征程上,首先要守好中国式现代化的本和源、根和魂,毫不动摇坚持中国式现代化的中国特色、本质要求和重大原则,坚持党的基本理论、基本路线、基本方略,坚持党的十八大以来的一系列重大方针政策,确保中国式现代化的正确方向”。
+
+推动改革行稳致远。改革开放是党和人民事业大踏步赶上时代的重要法宝。新时代全面深化改革取得了重大实践成果、制度成果、理论成果,是我国改革开放历史进程中最壮丽的篇章之一。改革开放只有进行时,没有完成时。习近平总书记强调,要“锚定继续完善和发展中国特色社会主义制度、推进国家治理体系和治理能力现代化这个总目标,以经济体制改革为牵引,统筹推进各领域各方面改革,坚决破除妨碍推进中国式现代化的思想观念和体制机制弊端,不断为中国式现代化提供强劲动力和制度保障”;“要敢于创新,把该改的、能改的改好、改到位,看准了就坚定不移抓”。
+
+更好担负起新的文化使命。文化关乎国本、国运。党的十八大以来,文化建设在正本清源、守正创新中取得历史性成就,社会主义文化强国建设迈出坚实步伐。当前,文化越来越成为综合国力竞争的重要力量,越来越成为强国建设、民族复兴的强大支撑。习近平总书记强调,要“坚持马克思主义的根本指导思想,传承弘扬革命文化,发展社会主义先进文化,从中华优秀传统文化中寻找源头活水”,“更好构筑中国精神、中国价值、中国力量”,明确要求“新时代的文化工作者必须以守正创新的正气和锐气,赓续历史文脉、谱写当代华章”。
+
+不断提高自我革命实效。勇于自我革命是我们党最鲜明的品格和最大优势。经过百余年奋斗特别是党的十八大以来全面从严治党的伟大实践,党找到了自我革命这一跳出治乱兴衰历史周期率的第二个答案,自我净化、自我完善、自我革新、自我提高能力显著增强。但也要清醒看到,全面从严治党永远在路上,党的自我革命永远在路上。习近平总书记深刻指出,“要坚持守正和创新相统一,坚守党的性质宗旨、理想信念、初心使命不动摇,同时要以新的理念、思路、办法、手段解决好党内存在的各种矛盾和问题,不断提高自我革命实效”。
+
+大道如砥,壮阔无垠。站在新的历史起点上,始终走正道、善于闯新路,以守正创新的定力和魄力,紧紧围绕推进中国式现代化进一步全面深化改革,必将不断谱写强国建设、民族复兴伟业的新篇章。
+
+
+
+
+
+
+
+
+
+
+来源/求是网
\ No newline at end of file
diff --git a/test/webpage_samples/task1/focus_point.json b/test/webpage_samples/task1/focus_point.json
new file mode 100644
index 0000000..fdf4a15
--- /dev/null
+++ b/test/webpage_samples/task1/focus_point.json
@@ -0,0 +1 @@
+[{"focuspoint": "社区治理", "explanation": "社区活动、社区课堂、居民活动、物业管理、业主自治、楼组建设、小区微更新、文明养宠、楼组长、团队建设、居委会标准化建设、美丽楼组、僵尸车、全岗通、小区充电桩、电动自行车、“五大委员会”工作、社区民主协商、一居一品、事实项目、社区治理效能、“四百”走访大调研、社区难点、社区痛点、赋能社区工作者这些方面的信息"}]
\ No newline at end of file
diff --git a/test/webpage_samples/task1/record-2024-12-18-14-17-30.txt b/test/webpage_samples/task1/record-2024-12-18-14-17-30.txt
new file mode 100644
index 0000000..9a76232
--- /dev/null
+++ b/test/webpage_samples/task1/record-2024-12-18-14-17-30.txt
@@ -0,0 +1,1718 @@
+focus statement: #社区治理
+解释:社区活动、社区课堂、居民活动、物业管理、业主自治、楼组建设、小区微更新、文明养宠、楼组长、团队建设、居委会标准化建设、美丽楼组、僵尸车、全岗通、小区充电桩、电动自行车、“五大委员会”工作、社区民主协商、一居一品、事实项目、社区治理效能、“四百”走访大调研、社区难点、社区痛点、赋能社区工作者这些方面的信息
+
+
+raw materials: 5f2bcb
+
+llm model: Qwen/Qwen2.5-7B-Instruct
+hallucination times: 1
+total analysis time: 0.8807568550109863
+
+author and publish time(not formated): {'source': '丁凌霄', 'publish_date': '2024-12-17'}
+infos(not formated):
+
+more urls:
+
+
+************
+
+llm model: THUDM/glm-4-9b-chat
+hallucination times: 0
+total analysis time: 3.9960761070251465
+
+author and publish time(not formated): {'source': '丁凌霄', 'publish_date': '2024-12-17'}
+infos(not formated):
+社区治理: 北站街道牵头相关部门在社区群众大力支持配合下,对居民社区和类住宅内的群租出租屋开展了贯穿全年的联合执法行动,清退了大量存在安全隐患的群租出租屋。全年共开展集中整治92次,对290户违法群租出租屋进行整治清退,对部分回潮的出租屋予以持续打击,全年整治总数达376户次(含反复整治)‼️同时,执法部门处罚一批违法经营群租出租屋的业主、二房东,督促上述主体合法出租房屋。街道将继续牵头各部门形成合力,紧盯群租现象易发的社区和楼栋,加强日常巡查排查,和社区居民一起及时发现群租线索。同时,持续保持高压打击力度,对群租现象露头就打,群租回潮标红处置,重点打击反复回潮、屡整不改的顽固群租现象,维护北站社区宜居宜商的和谐环境。欢迎社区群众向所在居委会、物业反馈身边的群租线索。📢💬☎️
+more urls:
+
+
+************
+
+llm model: deepseek-ai/DeepSeek-V2.5
+hallucination times: 1
+total analysis time: 4.5951879024505615
+
+author and publish time(not formated): {'source': '丁凌霄', 'publish_date': '2024年12月17日'}
+infos(not formated):
+
+more urls:
+
+
+************
+
+llm model: Qwen/QwQ-32B-Preview
+hallucination times: 0
+total analysis time: 15.104964017868042
+
+author and publish time(not formated): {'source': '丁凌霄', 'publish_date': '2024年12月17日'}
+infos(not formated):
+社区治理: 北站街道牵头相关部门在社区群众大力支持配合下,对居民社区和类住宅内的群租出租屋开展了贯穿全年的联合执法行动,清退了大量存在安全隐患的群租出租屋。全年共开展集中整治92次,对290户违法群租出租屋进行整治清退,对部分回潮的出租屋予以持续打击,全年整治总数达376户次(含反复整治)。同时,执法部门处罚一批违法经营群租出租屋的业主、二房东,督促上述主体合法出租房屋。街道将继续牵头各部门形成合力,紧盯群租现象易发的社区和楼栋,加强日常巡查排查,和社区居民一起及时发现群租线索。同时,持续保持高压打击力度,对群租现象露头就打,群租回潮标红处置,重点打击反复回潮、屡整不改的顽固群租现象,维护北站社区宜居宜商的和谐环境。欢迎社区群众向所在居委会、物业反馈身边的群租线索。
+more urls:
+
+
+************
+
+llm model: Qwen/Qwen2.5-Coder-32B-Instruct
+hallucination times: 1
+total analysis time: 1.0508511066436768
+
+author and publish time(not formated): {'source': '丁凌霄', 'publish_date': '2024-12-17'}
+infos(not formated):
+
+more urls:
+
+
+************
+
+llm model: Qwen/Qwen2.5-32B-Instruct
+hallucination times: 1
+total analysis time: 0.8369309902191162
+
+author and publish time(not formated): {'source': '丁凌霄', 'publish_date': '2024年12月17日'}
+infos(not formated):
+
+more urls:
+
+
+************
+
+llm model: Qwen/Qwen2.5-14B-Instruct
+hallucination times: 0
+total analysis time: 3.6911611557006836
+
+author and publish time(not formated): {'source': '丁凌霄', 'publish_date': '2024-12-17'}
+infos(not formated):
+社区治理: 2024年,北站街道牵头相关部门在社区群众大力支持配合下,对居民社区和类住宅内的群租出租屋开展了贯穿全年的联合执法行动,清退了大量存在安全隐患的群租出租屋。全年共开展集中整治92次,对290户违法群租出租屋进行整治清退,对部分回潮的出租屋予以持续打击,全年整治总数达376户次(含反复整治)‼️同时,执法部门处罚一批违法经营群租出租屋的业主、二房东,督促上述主体合法出租房屋。街道将继续牵头各部门形成合力,紧盯群租现象易发的社区和楼栋,加强日常巡查排查,和社区居民一起及时发现群租线索。同时,持续保持高压打击力度,对群租现象露头就打,群租回潮标红处置,重点打击反复回潮、屡整不改的顽固群租现象,维护北站社区宜居宜商的和谐环境。
+more urls:
+
+
+************
+
+llm model: Qwen/Qwen2.5-Coder-7B-Instruct
+hallucination times: 1
+total analysis time: 0.5193703174591064
+
+author and publish time(not formated): {'source': '丁凌霄', 'publish_date': '2024年12月17日'}
+infos(not formated):
+
+more urls:
+
+
+************
+
+llm model: 01-ai/Yi-1.5-34B-Chat-16K
+hallucination times: 0
+total analysis time: 4.0962159633636475
+
+author and publish time(not formated): {'source': '丁凌霄', 'publish_date': '2024-12-17'}
+infos(not formated):
+社区治理: 北站街道牵头相关部门在社区群众大力支持配合下,对居民社区和类住宅内的群租出租屋开展了贯穿全年的联合执法行动,清退了大量存在安全隐患的群租出租屋。全年共开展集中整治92次,对290户违法群租出租屋进行整治清退,对部分回潮的出租屋予以持续打击,全年整治总数达376户次(含反复整治)‼️同时,执法部门处罚一批违法经营群租出租屋的业主、二房东,督促上述主体合法出租房屋。街道将继续牵头各部门形成合力,紧盯群租现象易发的社区和楼栋,加强日常巡查排查,和社区居民一起及时发现群租线索。同时,持续保持高压打击力度,对群租现象露头就打,群租回潮标红处置,重点打击反复回潮、屡整不改的顽固群租现象,维护北站社区宜居宜商的和谐环境。
+more urls:
+
+
+************
+
+raw materials: f25bd2
+
+llm model: Qwen/Qwen2.5-7B-Instruct
+hallucination times: 4
+total analysis time: 3.6174869537353516
+
+author and publish time(not formated): {'source': '党建汇', 'publish_date': '2024年12月11日'}
+infos(not formated):
+
+more urls:
+
+
+************
+
+llm model: THUDM/glm-4-9b-chat
+hallucination times: 2
+total analysis time: 13.477967023849487
+
+author and publish time(not formated): {'source': '求是网', 'publish_date': '2024-12-11'}
+infos(not formated):
+社区治理: 党的十八大以来,中国特色社会主义进入新时代。党面临的主要任务是,实现第一个百年奋斗目标,开启实现第二个百年奋斗目标新征程,朝着实现中华民族伟大复兴的宏伟目标继续前进。面对世界百年未有之大变局,面对国情党情的深刻复杂变化,面对影响党长期执政、国家长治久安、人民幸福安康的突出矛盾和问题,守正创新比以往任何一个时期都更为紧迫、更为繁重。
+社区治理: 习近平总书记的一系列重要论述,深刻回答了事关坚持守正创新的一系列重大理论和实践问题,是对我们党历史经验特别是新时代伟大变革宝贵经验的科学总结,为新时代治国理政提供了重要指导,为推进强国建设、民族复兴伟业提供了重要遵循。
+社区治理: 习近平总书记强调,“守正和创新是辩证统一的,只有守正才能保证创新始终沿着正确方向前进,只有持续创新才能更好地守正”。在“守什么正”上,总书记强调,“坚持党的全面领导、坚持马克思主义、坚持中国特色社会主义、坚持人民民主专政,以促进社会公平正义、增进人民福祉为出发点和落脚点,这些都是管根本、管方向、管长远的,体现党的性质和宗旨,符合我国国情,符合人民根本利益,任何时候任何情况下都不能有丝毫动摇”
+社区治理: 党的二十大确立了全面建成社会主义现代化强国、实现第二个百年奋斗目标,以中国式现代化全面推进中华民族伟大复兴的中心任务,对推进中国式现代化作出战略部署。党的二十届三中全会,在新的历史起点上对进一步全面深化改革、推进中国式现代化作出了总动员、总部署。
+社区治理: 新时代全面深化改革取得了重大实践成果、制度成果、理论成果,是我国改革开放历史进程中最壮丽的篇章之一。改革开放只有进行时,没有完成时。
+社区治理: 新时代以来,在习近平生态文明思想科学指引下,生态文明建设从理论到实践都发生了历史性、转折性、全局性变化,生态文明体制改革纵深推进,生态文明制度体系基本形成,生态环境质量持续改善。
+社区治理: 陕西省安康市多年来通过建立“河湖长制+志愿者”护河机制,扎实推进汉江水质保护工作,使汉江出境断面水质稳定保持国家地表水Ⅱ类标准。
+社区治理: 推进马克思主义中国化时代化,必须始终坚守理论创新的魂和根,决不能抛弃马克思主义这个魂脉,决不能抛弃中华优秀传统文化这个根脉。
+社区治理: 习近平总书记鲜明强调,坚持守正创新就要坚持中国特色社会主义不动摇、坚定“四个自信”不动摇;明确指出,“我们强调坚定道路自信、理论自信、制度自信、文化自信,不是说就固步自封、不思进取了,我们必须不断有所发现、有所发明、有所创造、有所前进,使中国特色社会主义永远充满蓬勃生机活力。”},
+ {
+more urls:
+
+
+************
+
+llm model: deepseek-ai/DeepSeek-V2.5
+hallucination times: 4
+total analysis time: 20.75176191329956
+
+author and publish time(not formated): {'source': '求是网', 'publish_date': '2024年12月11日'}
+infos(not formated):
+
+more urls:
+
+
+************
+
+llm model: Qwen/QwQ-32B-Preview
+hallucination times: 0
+total analysis time: 114.85677313804626
+
+author and publish time(not formated): {'source': '党建汇', 'publish_date': '2024年12月11日'}
+infos(not formated):
+社区治理: 社区活动、社区课堂、居民活动、物业管理、业主自治、楼组建设、小区微更新、文明养宠、楼组长、团队建设、居委会标准化建设、美丽楼组、僵尸车、全岗通、小区充电桩、电动自行车、‘五大委员会’工作、社区民主协商、一居一品、事实项目、社区治理效能、‘四百’走访大调研、社区难点、社区痛点、赋能社区工作者这些方面的信息
+社区治理: 在我们党百余年的历史征程上,每一个历史时期都有自己的鲜明气象。2021年7月1日,北京天安门城楼,习近平总书记在庆祝中国共产党成立100周年大会上发表重要讲话,用32个字分别概括了我们党4个历史时期的鲜明气象,用“浴血奋战、百折不挠”概括新民主主义革命时期,用“自力更生、发愤图强”概括社会主义革命和建设时期,用“解放思想、锐意进取”概括改革开放和社会主义现代化建设新时期,用“自信自强、守正创新”概括新时代。守正创新是新时代的鲜明气象,也是我们党在新时代治国理政的重要思想方法。党的二十大概括阐述了习近平新时代中国特色社会主义思想的世界观、方法论和贯穿其中的立场观点方法,“必须坚持守正创新”是“六个必须坚持”之一;党的二十届三中全会明确把“坚持守正创新”作为进一步全面深化改革必须贯彻的“六个坚持”原则之一。党的十八大以来,中国特色社会主义进入新时代。党面临的主要任务是,实现第一个百年奋斗目标,开启实现第二个百年奋斗目标新征程,朝着实现中华民族伟大复兴的宏伟目标继续前进。面对世界百年未有之大变局,面对国情党情的深刻复杂变化,面对影响党长期执政、国家长治久安、人民幸福安康的突出矛盾和问题,守正创新比以往任何一个时期都更为紧迫、更为繁重。习近平总书记在团结带领全党全国各族人民进行具有许多新的历史特点的伟大斗争中,紧紧围绕坚持守正创新不断深入思索,作出一系列重要论述,不断丰富和发展坚持守正创新的思想内涵,彰显了强烈的问题意识和鲜明的实践导向。——关于什么是守正创新,习近平总书记强调,“守正和创新是辩证统一的,只有守正才能保证创新始终沿着正确方向前进,只有持续创新才能更好地守正”。在“守什么正”上,总书记强调,“坚持党的全面领导、坚持马克思主义、坚持中国特色社会主义、坚持人民民主专政,以促进社会公平正义、增进人民福祉为出发点和落脚点,这些都是管根本、管方向、管长远的,体现党的性质和宗旨,符合我国国情,符合人民根本利益,任何时候任何情况下都不能有丝毫动摇”;在“创什么新”上,总书记强调,“世界每时每刻都在发生变化,中国也每时每刻都在发生变化,我们必须在理论上跟上时代,不断认识规律,不断推进理论创新、实践创新、制度创新、文化创新以及其他各方面创新”。党的十八大以来,以习近平同志为核心的党中央高度重视科技创新,深入实施创新驱动发展战略,着力推动高质量发展,我国科技实力从量的积累迈向质的飞跃、从点的突破迈向系统能力提升,为经济社会平稳健康可持续发展提供了战略支撑。图为2024年10月16日拍摄的成都科创生态岛(无人机全景照片)。 新华社记者 刘坤/摄——关于为什么要守正创新,习近平总书记强调,“我提出守正创新,就是强调既不走封闭僵化的老路,也不走改旗易帜的邪路”,“无论时代如何发展,我们都要激发守正创新、奋勇向前的民族智慧”。总书记强调,“我们要永远记住,我们所进行的一切完善和改进,都是在既定方向上的继续前进,而不是改变方向,更不是要丢掉我们党、国家、人民安身立命的根本”;“要学马列主义,但马列主义经典著作不能给出解决现实问题的现成答案,只能运用它的原理、立场、观点、方法,通过自己的摸索、咀嚼、创新来提出答案。西方的东西要借鉴,但不能完全吃它这碗饭,不能全盘接受”;“我们搞的事业,我们是先行者、探索者,没有人给我们提供可以采用拿来主义态度的经验,必须通过理论上不断探索、不断突破来指导实践,并用实践中摸索到的规律来升华我们的理论”。——关于怎样守正创新,习近平总书记强调,“要坚持守正和创新相统一”,“守正就不能偏离马克思主义、社会主义,但不是刻舟求剑,还要往前发展、与时俱进,否则就是僵化的、陈旧的、过时的”;“理论创新必须讲新话,但不能丢了老祖宗,数典忘祖就等于割断了魂脉和根脉,最终会犯失去魂脉和根脉的颠覆性错误”。总书记强调,“要准确把握时代大势,勇于站在人类发展前沿,聆听人民心声,回应现实需要,坚持解放思想、实事求是、守正创新,更好把坚持马克思主义和发展马克思主义统一起来,坚持用马克思主义之‘矢’去射新时代中国之‘的’”;“我们的改革是有方向、有原则的”,“要坚持继续完善和发展中国特色社会主义制度、推进国家治理体系和治理能力现代化的改革总目标,始终朝着总目标指引的方向前进,该改的坚决改,不该改的不改。要顺应时代发展新趋势、实践发展新要求、人民群众新期待,突出经济体制改革这个重点,全面协调推进各方面改革,大力推进理论创新、实践创新、制度创新、文化创新以及其他各方面创新”。习近平总书记的一系列重要论述,深刻回答了事关坚持守正创新的一系列重大理论和实践问题,是对我们党历史经验特别是新时代伟大变革宝贵经验的科学总结,为新时代治国理政提供了重要指导,为推进强国建设、民族复兴伟业提供了重要遵循。正是在新时代守正创新的伟大实践中,以习近平同志为主要代表的中国共产党人,坚持把马克思主义基本原理同中国具体实际相结合、同中华优秀传统文化相结合,科学回答了新时代坚持和发展什么样的中国特色社会主义、怎样坚持和发展中国特色社会主义等重大时代课题,创立了习近平新时代中国特色社会主义思想。这一重要思想,既坚持了老祖宗、又讲了许多新话,以全新的视野深化了对共产党执政规律、社会主义建设规律、人类社会发展规律的认识,为发展马克思主义作出了原创性贡献,实现了马克思主义中国化时代化新的飞跃。
+社区治理: 社区活动、社区课堂、居民活动、物业管理、业主自治、楼组建设、小区微更新、文明养宠、楼组长、团队建设、居委会标准化建设、美丽楼组、僵尸车、全岗通、小区充电桩、电动自行车、'五大委员会'工作、社区民主协商、一居一品、事实项目、社区治理效能、'四百'走访大调研、社区难点、社区痛点、赋能社区工作者这些方面的信息
+社区治理: 不断提高自我革命实效。勇于自我革命是我们党最鲜明的品格和最大优势。经过百余年奋斗特别是党的十八大以来全面从严治党的伟大实践,党找到了自我革命这一跳出治乱兴衰历史周期率的第二个答案,自我净化、自我完善、自我革新、自我提高能力显著增强。但也要清醒看到,全面从严治党永远在路上,党的自我革命永远在路上。习近平总书记深刻指出,“要坚持守正和创新相统一,坚守党的性质宗旨、理想信念、初心使命不动摇,同时要以新的理念、思路、办法、手段解决好党内存在的各种矛盾和问题,不断提高自我革命实效”。大道如砥,壮阔无垠。站在新的历史起点上,始终走正道、善于闯新路,以守正创新的定力和魄力,紧紧围绕推进中国式现代化进一步全面深化改革,必将不断谱写强国建设、民族复兴伟业的新篇章。来源/求是网
+more urls:
+
+
+************
+
+llm model: Qwen/Qwen2.5-Coder-32B-Instruct
+hallucination times: 4
+total analysis time: 3.633725881576538
+
+author and publish time(not formated): {'source': '习近平', 'publish_date': '2024-12-11'}
+infos(not formated):
+
+more urls:
+
+
+************
+
+llm model: Qwen/Qwen2.5-32B-Instruct
+hallucination times: 4
+total analysis time: 2.5963938236236572
+
+author and publish time(not formated): {'source': '党建汇', 'publish_date': '2024年12月11日'}
+infos(not formated):
+
+more urls:
+
+
+************
+
+llm model: Qwen/Qwen2.5-14B-Instruct
+hallucination times: 4
+total analysis time: 2.5436830520629883
+
+author and publish time(not formated): {'source': '党建汇', 'publish_date': '2024-12-11'}
+infos(not formated):
+
+more urls:
+
+
+************
+
+llm model: Qwen/Qwen2.5-Coder-7B-Instruct
+hallucination times: 4
+total analysis time: 4.913423776626587
+
+author and publish time(not formated): {'source': '党建汇', 'publish_date': '2024年12月11日'}
+infos(not formated):
+
+more urls:
+
+
+************
+
+llm model: 01-ai/Yi-1.5-34B-Chat-16K
+hallucination times: 0
+total analysis time: 10.549503087997437
+
+author and publish time(not formated): {'source': '党建汇', 'publish_date': '2024-12-11'}
+infos(not formated):
+社区治理: 社区治理效能
+社区治理: 社区治理效能
+社区治理: 社区民主协商
+社区治理: 社区难点
+社区治理: 社区痛点
+社区治理: 赋能社区工作者
+社区治理: 习近平总书记在《必须坚持守正创新》这篇重要文章中反复强调,‘守正才能不迷失方向、不犯颠覆性错误,创新才能把握时代、引领时代’。新征程上,我们必须牢牢坚持守正创新不动摇,不断开创马克思主义中国化时代化新境界,不断开创治国理政新境界。
+社区治理: 党的自我革命永远在路上,习近平总书记深刻指出,‘要坚持守正和创新相统一,坚守党的性质宗旨、理想信念、初心使命不动摇,同时要以新的理念、思路、办法、手段解决好党内存在的各种矛盾和问题,不断提高自我革命实效’。
+more urls:
+
+
+************
+
+raw materials: 7cfff6
+
+llm model: Qwen/Qwen2.5-7B-Instruct
+hallucination times: 1
+total analysis time: 0.7375659942626953
+
+author and publish time(not formated): {'source': '黄浦党建', 'publish_date': '2024-12-17'}
+infos(not formated):
+
+more urls:
+
+
+************
+
+llm model: THUDM/glm-4-9b-chat
+hallucination times: 0
+total analysis time: 1.2021160125732422
+
+author and publish time(not formated): {'source': 'NA', 'publish_date': '2024-12-17'}
+infos(not formated):
+社区课堂: 一图读懂——黄浦“零距离”学院、讲堂“四库五课”资源库
+more urls:
+
+
+************
+
+llm model: deepseek-ai/DeepSeek-V2.5
+hallucination times: 1
+total analysis time: 2.998087167739868
+
+author and publish time(not formated): {'source': '黄浦党建', 'publish_date': '2024年12月17日'}
+infos(not formated):
+
+more urls:
+
+
+************
+
+llm model: Qwen/QwQ-32B-Preview
+hallucination times: 0
+total analysis time: 5.363601922988892
+
+author and publish time(not formated): {'source': '黄浦党建 黄浦党建', 'publish_date': '2024年12月17日'}
+infos(not formated):
+社区治理: 黄浦'零距离'学院、讲堂'四库五课'资源库
+more urls:
+
+
+************
+
+llm model: Qwen/Qwen2.5-Coder-32B-Instruct
+hallucination times: 1
+total analysis time: 0.7791969776153564
+
+author and publish time(not formated): {'source': 'NA', 'publish_date': '2024年12月17日'}
+infos(not formated):
+
+more urls:
+
+
+************
+
+llm model: Qwen/Qwen2.5-32B-Instruct
+hallucination times: 1
+total analysis time: 0.6867458820343018
+
+author and publish time(not formated): {'source': '黄浦党建', 'publish_date': '2024-12-17'}
+infos(not formated):
+
+more urls:
+
+
+************
+
+llm model: Qwen/Qwen2.5-14B-Instruct
+hallucination times: 1
+total analysis time: 0.5729451179504395
+
+author and publish time(not formated): {'source': '黄浦党建', 'publish_date': '2024-12-17'}
+infos(not formated):
+
+more urls:
+
+
+************
+
+llm model: Qwen/Qwen2.5-Coder-7B-Instruct
+hallucination times: 1
+total analysis time: 0.4428839683532715
+
+author and publish time(not formated): {'source': 'NA', 'publish_date': '2024-12-17'}
+infos(not formated):
+
+more urls:
+
+
+************
+
+llm model: 01-ai/Yi-1.5-34B-Chat-16K
+hallucination times: 0
+total analysis time: 1.2354381084442139
+
+author and publish time(not formated): {'source': '黄浦党建', 'publish_date': '2024-12-17'}
+infos(not formated):
+社区治理: 黄浦‘零距离’学院、讲堂‘四库五课’资源库
+more urls:
+
+
+************
+
+raw materials: ee88f6
+
+llm model: Qwen/Qwen2.5-7B-Instruct
+hallucination times: 2
+total analysis time: 1.020636796951294
+
+author and publish time(not formated): {'source': '芷江新视野', 'publish_date': '2024-12-16'}
+infos(not formated):
+
+more urls:
+
+
+************
+
+llm model: THUDM/glm-4-9b-chat
+hallucination times: 1
+total analysis time: 1.842561960220337
+
+author and publish time(not formated): {'source': '党群办、复元坊居民区', 'publish_date': '2024-12-16'}
+infos(not formated):
+社区治理: 复元坊居民区党员志愿者、退役军人刘玉鹏
+more urls:
+
+
+************
+
+llm model: deepseek-ai/DeepSeek-V2.5
+hallucination times: 2
+total analysis time: 2.8885717391967773
+
+author and publish time(not formated): {'source': '社区晨报', 'publish_date': '2024年12月16日'}
+infos(not formated):
+
+more urls:
+
+
+************
+
+llm model: Qwen/QwQ-32B-Preview
+hallucination times: 0
+total analysis time: 10.700487852096558
+
+author and publish time(not formated): {'source': '芷江新视野', 'publish_date': '2024-12-16'}
+infos(not formated):
+社区治理: 在给定的网页文本中,没有找到与社区治理相关的任何信息。
+社区治理: 开展谈心活动是部队思想政治工作传统行之有效方法。
+more urls:
+
+
+************
+
+llm model: Qwen/Qwen2.5-Coder-32B-Instruct
+hallucination times: 2
+total analysis time: 1.3591291904449463
+
+author and publish time(not formated): {'source': 'NA', 'publish_date': '2024年12月16日'}
+infos(not formated):
+
+more urls:
+
+
+************
+
+llm model: Qwen/Qwen2.5-32B-Instruct
+hallucination times: 2
+total analysis time: 1.9232063293457031
+
+author and publish time(not formated): {'source': '芷江新视野', 'publish_date': '2024-12-16'}
+infos(not formated):
+
+more urls:
+
+
+************
+
+llm model: Qwen/Qwen2.5-14B-Instruct
+hallucination times: 2
+total analysis time: 1.1885738372802734
+
+author and publish time(not formated): {'source': '社区晨报', 'publish_date': '2024-12-16'}
+infos(not formated):
+
+more urls:
+
+
+************
+
+llm model: Qwen/Qwen2.5-Coder-7B-Instruct
+hallucination times: 2
+total analysis time: 0.8024210929870605
+
+author and publish time(not formated): {'source': 'NA', 'publish_date': '2024年12月16日'}
+infos(not formated):
+
+more urls:
+
+
+************
+
+llm model: 01-ai/Yi-1.5-34B-Chat-16K
+hallucination times: 0
+total analysis time: 3.7613868713378906
+
+author and publish time(not formated): {'source': '芷江新视野', 'publish_date': '2024-12-16'}
+infos(not formated):
+社区治理: 传承红色基因,七旬老兵刘玉鹏在复元坊居民区作为党员志愿者,通过分享他的《新兵日记》,赓续红色血脉,参与社区活动,传承红色基因。
+社区治理: 开展谈心活动是部队思想政治工作传统行之有效方法。刚开始,刘玉鹏学习《为人民服务》《愚公移山》《纪念白求恩》“老三篇”文章,在劳动中认真磨炼自己,在生活中助人为乐。”
+more urls:
+
+
+************
+
+raw materials: 8c1617
+
+llm model: Qwen/Qwen2.5-7B-Instruct
+hallucination times: 4
+total analysis time: 3.975717067718506
+
+author and publish time(not formated): {'source': 'NA', 'publish_date': 'NA'}
+infos(not formated):
+
+more urls:
+红色中国
+中国经济网
+光明网
+求是网
+中国网信网
+中国文明网
+京ICP备18000311号-1
+
+************
+
+llm model: THUDM/glm-4-9b-chat
+hallucination times: 2
+total analysis time: 42.68907594680786
+
+author and publish time(not formated): {'source': '习近平文汇', 'publish_date': 'NA'}
+infos(not formated):
+社区治理: 江西广昌:“莲心议事”切实解决群众身边“关键小事”
+社区治理: 浙江台州:三门健跳 鲜到先得汪贤挺:我给小鲵当“爸爸”
+社区治理: 江西上饶:婺源茶惊艳亮相茶博会引关注
+社区治理: 安徽巢湖:以党建“穿针”服务“引线” 助力城市基层治理提质增效
+社区治理: 河南灵宝:“黄河熔金”奇观带火黄土塬旅游
+社区治理: 吉林通化县:四举措推动移风易俗 绘就文明乡风新“底色”
+社区治理: 青海尖扎:全力做好冬季供暖保障工作
+社区治理: 中共中央举行纪念乔石同志诞辰100周年座谈会 习近平发表重要讲话
+社区治理: 习近平听取李家超述职报告
+社区治理: 中央经济工作会议在北京举行 习近平发表重要讲话
+社区治理: 深入推进新时代国有企业党建工作坚持守正创新 担负起新时代新的文化使命培育发展新质生产力的新动能不断提升国家文化软实力和中华文化影响力
+社区治理: 坚持用科学方法推动改革行稳致远发挥制度优势 凝聚奋进力量
+社区治理: 坚持“两个结合”推进马克思主义中国化时代化——“首都当代中国马克思主义论坛·2024”发言摘登
+社区治理: 以系统观念加强党的建设积极参与构建公正合理的全球治理体系
+社区治理: 牢记殷切嘱托 争当改革先锋
+社区治理: 中国经济长期向好的支撑条件和基本趋势没有变深化价格改革完善要素市场制度和规则努力使党史党建学科建设更加精彩
+社区治理: 文化广场打开梵净山下云舍间日常生活有文韵我是一条洄游的鱼麦浪滚滚江中题刻白鹤梁柏子和柏叶大列巴和冰啤酒一院子的“生长”悠悠漳溪河
+社区治理: 宪法精神大家谈|张翔:备案审查制度取得巨大的进步
+社区治理: 法治新闻法治时评 政法法律法规普法课堂法治视频法治人物知识产权
+社区治理: 全国人大常委会首次将年度备案审查报告及审议意见交由有关制定机关研究处理
+社区治理: 司法部党组传达学习中央经济工作会议精神聚焦发展蓝图 勇担职责使命 推动基层法学会工作再创佳绩
+社区治理: 地方规范性文件数据库不断扩容 全国省级数据库已收录各类规范性文件38万多件
+社区治理: 把政府行为全面纳入法治轨道以高质量政府立法服务保障高质量发展
+社区治理: 陕西对33项专利密集型产品进行奖补记山东蒙阴法院民事审判一庭庭长魏善辉山东青岛前10个月有效发明专利拥有量8.32万件销售假冒品牌商品价值190余万元 一家三口被判刑
+社区治理: 宪法书签DIY活动征集公告今日说法(2024)法治深壹度(2024)天网(2024)全国百强期刊(选)社科词条库首页-学习强国-学习慕课学习强国-首页-国图公开课
+社区治理: 永远的丰碑经典著作红色记忆党史学习永远的丰碑查看全部李大钊:中国共产党的创始人之一蔡和森:中国共产党工人运动领袖董必武:中国共产党的创始人之一何叔衡:中国共产党的创始人之一方志敏:伟大的共产主义战士刘胡兰:生的伟大死的光荣马本斋:百战百胜的回民支队司令员左 权:中国工农红军高级指挥员
+社区治理: 享誉中外的科学家和教育家——卢嘉锡生是为中国 死是为中国——刘伯坚杰出的红军指挥员——蔡申熙党的早期农民运动的领导人——罗学瓒
+more urls:
+中工网
+党建网
+中青在线
+中国军网
+法治网
+求是网
+中国网信网
+中国文明网
+中国政府网
+教育部网站
+国防部网站
+文化和旅游部网站
+国新办网站
+中国扫黄打非网
+女性之声
+中国报业
+中央网信办举报中心
+千龙网
+中国社会科学网
+中国科技网
+中国农业新闻网
+中国法律服务网
+中国普法网
+中国西藏网
+
+************
+
+llm model: deepseek-ai/DeepSeek-V2.5
+hallucination times: 4
+total analysis time: 222.5952730178833
+
+author and publish time(not formated): {'source': '中共中央宣传部宣传舆情研究中心', 'publish_date': '2018-2024'}
+infos(not formated):
+
+more urls:
+习近平文汇
+学习电视台
+学习文化
+人民网
+新华网
+中国网
+央视网
+中国新闻网
+光明网
+央广网
+中国文明网
+中国政府网
+文化和旅游部网站
+国新办网站
+千龙网
+中国社会科学网
+中国法律服务网
+中国普法网
+中国妇女网
+
+************
+
+llm model: Qwen/QwQ-32B-Preview
+hallucination times: 2
+total analysis time: 226.97846508026123
+
+author and publish time(not formated): {'source': '中央宣传部宣传舆情研究中心', 'publish_date': '2024-01-01'}
+infos(not formated):
+社区治理: 社区活动、社区课堂、居民活动、物业管理、业主自治、楼组建设、小区微更新、文明养宠、楼组长、团队建设、居委会标准化建设、美丽楼组、僵尸车、全岗通、小区充电桩、电动自行车、‘五大委员会’工作、社区民主协商、一居一品、事实项目、社区治理效能、‘四百’走访大调研、社区难点、社区痛点、赋能社区工作者这些方面的信息
+社区治理: 社区活动、社区课堂、居民活动、物业管理、业主自治、楼组建设、小区微更新、文明养宠、楼组长、团队建设、居委会标准化建设、美丽楼组、僵尸车、全岗通、小区充电桩、电动自行车、‘五大委员会’工作、社区民主协商、一居一品、事实项目、社区治理效能、‘四百’走访大调研、社区难点、社区痛点、赋能社区工作者这些方面的信息
+社区治理: 社区活动、社区课堂、居民活动、物业管理、业主自治、楼组建设、小区微更新、文明养宠、楼组长、团队建设、居委会标准化建设、美丽楼组、僵尸车、全岗通、小区充电桩、电动自行车、‘五大委员会’工作、社区民主协商、一居一品、事实项目、社区治理效能、‘四百’走访大调研、社区难点、社区痛点、赋能社区工作者这些方面的信息
+社区治理: 社区活动、社区课堂、居民活动、物业管理、业主自治、楼组建设、小区微更新、文明养宠、楼组长、团队建设、居委会标准化建设、美丽楼组、僵尸车、全岗通、小区充电桩、电动自行车、'五大委员会'工作、社区民主协商、一居一品、事实项目、社区治理效能、'四百'走访大调研、社区难点、社区痛点、赋能社区工作者
+more urls:
+人民网
+新华网
+中国网
+央视网
+国际在线
+中国日报网
+中国青年网
+中国经济网
+中国新闻网
+光明网
+中工网
+党建网
+中青在线
+法治网
+求是网
+中国网信网
+
+************
+
+llm model: Qwen/Qwen2.5-Coder-32B-Instruct
+hallucination times: 4
+total analysis time: 63.391595125198364
+
+author and publish time(not formated): {'source': '习近平', 'publish_date': 'NA'}
+infos(not formated):
+
+more urls:
+人民网
+新华网
+中国新闻网
+光明网
+党建网
+求是网
+中国文明网
+中国政府网
+
+************
+
+llm model: Qwen/Qwen2.5-32B-Instruct
+hallucination times: 4
+total analysis time: 18.497122049331665
+
+author and publish time(not formated): {'source': 'NA', 'publish_date': 'NA'}
+infos(not formated):
+
+more urls:
+人民网
+新华网
+中国新闻网
+光明网
+法治网
+中国文明网
+
+************
+
+llm model: Qwen/Qwen2.5-14B-Instruct
+hallucination times: 4
+total analysis time: 23.159822940826416
+
+author and publish time(not formated): {'source': 'NA', 'publish_date': 'NA'}
+infos(not formated):
+
+more urls:
+
+
+************
+
+llm model: Qwen/Qwen2.5-Coder-7B-Instruct
+hallucination times: 4
+total analysis time: 9.421772956848145
+
+author and publish time(not formated): {'source': 'NA', 'publish_date': 'NA'}
+infos(not formated):
+
+more urls:
+五个一工程
+人民网
+新华网
+中国网
+央视网
+国际在线
+中国日报网
+中国青年网
+中国经济网
+中国新闻网
+光明网
+央广网
+中工网
+党建网
+中青在线
+中国军网
+法治网
+求是网
+中国网信网
+
+************
+
+llm model: 01-ai/Yi-1.5-34B-Chat-16K
+hallucination times: 2
+total analysis time: 40.002163887023926
+
+author and publish time(not formated): {'source': '习近平', 'publish_date': '2024-01-01'}
+infos(not formated):
+社区治理: 物业管理、业主自治、文明养宠、居委会标准化建设、社区民主协商、社区治理效能
+社区治理: 物业管理、业主自治、文明养宠、居委会标准化建设、社区民主协商、社区治理效能
+社区治理: 社区活动、社区课堂、居民活动、物业管理、业主自治、楼组建设、小区微更新、文明养宠、楼组长、团队建设、居委会标准化建设、美丽楼组、僵尸车、全岗通、小区充电桩、电动自行车、“五大委员会”工作、社区民主协商、一居一品、事实项目、社区治理效能、“四百”走访大调研、社区难点、社区痛点、赋能社区工作者
+more urls:
+习近平文汇
+人民网
+新华网
+中国网
+央视网
+国际在线
+中国日报网
+中国青年网
+中国经济网
+中国新闻网
+光明网
+央广网
+党建网
+中青在线
+中国军网
+法治网
+求是网
+中国网信网
+中国文明网
+中国政府网
+教育部网站
+文化和旅游部网站
+中国扫黄打非网
+女性之声
+中国报业
+中央网信办举报中心
+千龙网
+中国社会科学网
+中国科技网
+中国农业新闻网
+西影网
+中国法律服务网
+中国普法网
+
+************
+
+raw materials: 922b31
+
+llm model: Qwen/Qwen2.5-7B-Instruct
+hallucination times: 4
+total analysis time: 104.50274682044983
+
+author and publish time(not formated): {'source': 'NA', 'publish_date': 'NA'}
+infos(not formated):
+
+more urls:
+党建
+领导留言板
+人民建议
+京
+津
+冀
+晋
+蒙
+辽
+吉
+黑
+沪
+浙
+皖
+闽
+赣
+鲁
+豫
+鄂
+湘
+粤
+桂
+琼
+渝
+川
+黔
+滇
+藏
+陕
+甘
+青
+宁
+新
+中央社会工作部
+人民日报
+中国城市报
+新闻战线
+人民论坛
+当前经济形势怎么看?
+解读2024年中央经济工作会议精神
+中共中央举行纪念乔石同志诞辰100周年座谈会 习近平发表重要讲话
+初心如磐,"莲花卫士"护濠江
+浦东首创居民自治金项目试点从居民区推向乡村
+民政部等三部门联合印发《乡村地名建设指南1.0版》
+办实事|立交桥下人行道及非机动车道常年积水 江西南昌:已解决
+整治形式主义为基层减负工作平台
+湖北咸宁:提升纪检监察建议质效
+辽宁专项整治高标准农田建设突出问题
+2024网上群众工作大会|
+“我给两会捎句话”启动
+金台视线|让社区食堂实现可持续发展
+人民网记者遍神州
+电动汽车供电设备强制认证将解决哪些问题和隐患?
+业委会换了,电梯更换还能继续履行吗?
+青海西宁:非遗唐卡“画”进高校课堂
+安徽省检察院举行开放日活动 代表委员建言献策
+“何以中国”的山东故事
+[详情]
+人民日报社社会责任报告(2022年度)
+红网
+东方网
+广播电视节目制作经营许可证(广媒)字第172号
+京ICP证000006号
+
+************
+
+llm model: THUDM/glm-4-9b-chat
+hallucination times: 2
+total analysis time: 201.54251909255981
+
+author and publish time(not formated): {'source': 'NA', 'publish_date': 'NA'}
+infos(not formated):
+社区治理: 陈吉宁调研企业浦东首创居民自治金项目试点从居民区推向乡村
+社区治理: 马鞍山雨山区:“三中心”落地,“一站式”助企强化党建引领园区合作共建管理模式,营造“15分钟生活娱乐圈”,为高质量发展积蓄新动能。
+社区治理: 民政部等三部门联合印发《乡村地名建设指南1.0版》事关央企上市公司市值管理!国务院国资委出新规
+社区治理: 中国海警局新闻发言人就菲向非法
+社区治理: 一幅乡村振兴新图景正在辽沈沃野徐徐展开。产业兴旺、生态宜居、乡风文明、治理有效、生活富裕。
+社区治理: 社会·法治分享科技赋能农机 田野拥抱智慧
+社区治理: 国家大学科技园为科技成果转化搭建重要平台2024年初,国家大学科技园转由教育部牵头管理,健步走上高质量发展快车道。
+社区治理: 在科技成果转化的重大使命面前,其发展状况如何,又面临着哪些亟待解决的问题?
+社区治理: 宁夏:六盘山下冰雪赛事“燃”河钢全球首条氢冶金绿色汽车板连铸生产线投产
+社区治理: 北京“守夜人”“何以中国”的山东故事
+社区治理: 广东深圳龙华:客家古村焕新生文化中国行文艺星开讲
+more urls:
+党建
+社会 · 法治
+教育
+科普
+人民网评
+三评
+人民财评
+人民来论
+人民访谈
+领导留言板
+强国论坛
+828企业服务平台
+人民建议
+“大思政课”云平台
+视频
+图解
+聚力微光
+津
+冀
+晋
+蒙
+辽
+吉
+黑
+沪
+苏
+浙
+皖
+赣
+鲁
+豫
+川
+滇
+陕
+甘
+青
+宁
+新
+中共中央党史和文献研究院
+文化企业社会责任报告发布平台
+中国国民党革命委员会
+“人民消费”中消协教育课堂
+传播内容认知全国重点实验室
+人民审校
+智能写作
+白泽
+人民网客户端
+人民日报
+人民日报海外版
+健康时报
+讽刺与幽默
+中国城市报
+新闻战线
+人民论坛
+中国经济周刊
+民生周刊
+人民周刊
+人民数字
+人民网研究院
+人民网智慧党建体验中心
+当前经济形势怎么看?
+解读2024年中央经济工作会议精神
+坚定必胜信心,把各方面积极因素转化为发展实绩
+本固枝荣:坚持和落实“两个毫不动摇”
+中国式现代化一个都不能少
+河南内黄:“冬闲”人不闲 增收致富忙
+擦亮和美乡村幸福底色
+学习·故事|习近平:"老梁,给你带了一份纪念品"
+李强主持国务院第十一次专题学习
+庆祝澳门回归25周年
+初心如磐,"莲花卫士"护濠江
+中国制造向"新"攀登 折射经济韧性活力
+传统产业创新底色足、发展潜力大
+全谷物消费带动节粮减损 提高国民营养健康水平
+浦东首创居民自治金项目试点从居民区推向乡村
+要闻
+2024中国正能量网络精品征集展播活动启动
+关于第九届全国道德模范候选人的公示
+外交部:欢迎外国朋友继续"种草"中国
+我国加快以标准提升引领原材料工业优化升级
+稳外贸、稳外资 明年工作这么干
+民政部等三部门联合印发《乡村地名建设指南1.0版》
+办实事|立交桥下人行道及非机动车道常年积水 江西南昌:已解决
+马鞍山雨山区:“三中心”落地,“一站式”助企
+整治形式主义为基层减负工作平台
+党员学习园地
+湖北咸宁:提升纪检监察建议质效
+辽宁专项整治高标准农田建设突出问题
+毛泽东的读书治学之道
+鲁南第二军分区攻坚大王庙
+2024网上群众工作大会|
+湖北罗田回复网友:尽快优化并开通公交线路
+金台视线|让社区食堂实现可持续发展
+身边事|工地围挡长期未拆 影响通行
+建议|整治中小学周边游戏推广
+反馈|加大巡查力度 守护水域生态
+查看留言
+我要留言
+人民网记者遍神州
+人民网记者遍全球
+山东手造丨淄博琉璃灯工:火中的雕塑
+回顾2024年中国军事大场面
+复兴之路|巍巍纪念塔 拳拳追思情
+党的二十大专题
+总书记的人民情怀
+新思想引领新时代改革开放
+35个!2024年国家先进制造业集群名单公布
+人民会客厅
+开放谈:以创新引领数字贸易高质量发展
+电动汽车供电设备强制认证将解决哪些问题和隐患?
+生态
+喜看“三农”新图景:农业更高效 乡村更美好
+新研究揭示人类基因流动复杂历史
+流感高发,如何预防与应对?
+一吨煤的绿色转型
+司法“精耕细作” “滴灌”乡村田野
+科技赋能农机 田野拥抱智慧
+千年古镇,法庭绘就新“枫”景
+黑龙江:构建“快进快退”破产案件审判机制
+广东东莞二院:法庭与司法分局联手化解租赁纠纷
+业委会换了,电梯更换还能继续履行吗?
+国家大学科技园为科技成果转化搭建重要平台
+让优质教育资源润泽雪域高原
+体教融合,为振兴三大球强基固本
+农业研学应“研”之有道
+贵阳综合保税区今年以来引才近1400人
+积极构建中国自主的教育学知识体系
+青海西宁:非遗唐卡“画”进高校课堂
+中美合作造福两国,更是大势所趋、世界期待
+韩国宪法法院要求尹锡悦23日前提交弹劾案答辩
+朔尔茨未通过联邦议院信任投票
+圣彼得堡举办马戏主题展
+和平力量相遇深蓝航道
+网联中国
+大河之南 兴起新文旅
+安徽省检察院举行开放日活动 代表委员建言献策
+贵州举行森林防火主题宣传活动
+“简牍学文库”项目启动暨编纂出版座谈会举行
+宁夏:六盘山下冰雪赛事“燃”
+体育
+全国桥牌通讯赛全年赛事落幕
+深圳龙华:客家古村焕新生
+文化中国行
+文艺星开讲
+滇南有灵草 名曰灯盏花
+免费场馆加量 健康生活加码
+在中华饮食文化中品味健康之道
+落实防控指南 密集场所如何有效防控诺如病毒?
+防治心肌纤维化有了新途径
+人民日报社社会责任报告(2022年度)
+学习贯彻习近平新时代中国特色社会主义思想主题教育官网正式上线
+“跟着总书记学党史数据库”正式上线
+日本
+网站地图
+中央纪委国家监委
+统战部
+中联部
+中央政法委
+中央台办
+中央编办
+全国人大
+全国政协
+中国政府网
+中国网信网
+中国文明网
+法治网
+中工网
+千龙网
+华龙网
+齐鲁网
+红网
+天山网
+荆楚网
+北方网
+南方网
+中国残联
+中国作家网
+中国民主促进会
+中国志愿服务联合会
+东方网
+人民文旅网
+中国小康网
+党建网
+人民日报社概况
+报社招聘
+招聘英才
+广告服务
+合作加盟
+供稿服务
+数据服务
+网站声明
+网站律师
+信息保护
+联系我们
+互联网新闻信息服务许可证10120170001
+增值电信业务经营许可证B1-20060139
+广播电视节目制作经营许可证(广媒)字第172号
+京ICP备12004265号-13
+信息网络传播视听节目许可证0104065
+京ICP证000006号
+
+************
+
+llm model: deepseek-ai/DeepSeek-V2.5
+hallucination times: 3
+total analysis time: 9917.176270723343
+
+author and publish time(not formated): {'source': '人民网', 'publish_date': '1997-2024'}
+infos(not formated):
+
+more urls:
+党网 · 时政
+理论
+党建
+经济 · 科技
+社会 · 法治
+文旅 · 体育
+健康 · 生活
+教育
+科普
+人民网评
+三评
+人民来论
+人民访谈
+领导留言板
+强国论坛
+人民建议
+视频
+图解
+聚力微光
+京
+津
+冀
+晋
+蒙
+辽
+吉
+黑
+沪
+苏
+浙
+皖
+闽
+赣
+鲁
+豫
+鄂
+湘
+粤
+桂
+琼
+渝
+川
+黔
+滇
+藏
+陕
+甘
+青
+宁
+新
+中央社会工作部
+学习强国
+中国城市报
+人民论坛
+民生周刊
+人民周刊
+环球网
+海外网
+人民网研究院
+人民网智慧党建体验中心
+当前经济形势怎么看?
+解读2024年中央经济工作会议精神
+坚定必胜信心,把各方面积极因素转化为发展实绩
+中国式现代化一个都不能少
+擦亮和美乡村幸福底色
+浦东首创居民自治金项目试点从居民区推向乡村
+关于第九届全国道德模范候选人的公示
+办实事|立交桥下人行道及非机动车道常年积水 江西南昌:已解决
+金融赋能 托起幸福“夕阳红”
+整治形式主义为基层减负工作平台
+党员学习园地
+2024网上群众工作大会|
+金台视线|让社区食堂实现可持续发展
+身边事|工地围挡长期未拆 影响通行
+人民网记者遍神州
+人民网记者遍全球
+党的二十大专题
+总书记的人民情怀
+“行进中国”调研行
+人民会客厅
+电动汽车供电设备强制认证将解决哪些问题和隐患?
+科技
+流感高发,如何预防与应对?
+业委会换了,电梯更换还能继续履行吗?
+青海西宁:非遗唐卡“画”进高校课堂
+广东省珠海市大力解决驻军部队难题
+发挥老兵余热 讲好国防故事
+安徽省检察院举行开放日活动 代表委员建言献策
+北京“守夜人”
+“没想到中国乡村这么有魅力”
+深圳龙华:客家古村焕新生
+文化中国行
+文艺星开讲
+健康
+免费场馆加量 健康生活加码
+在中华饮食文化中品味健康之道
+落实防控指南 密集场所如何有效防控诺如病毒?
+防治心肌纤维化有了新途径
+人民日报社社会责任报告(2022年度)
+人民网
+全国人大
+全国政协
+中国文明网
+新华网
+央视网
+光明网
+中国新闻网
+中国网
+法治网
+央广网
+千龙网
+华龙网
+齐鲁网
+红网
+天山网
+荆楚网
+北方网
+南方网
+中国志愿服务联合会
+东方网
+中国小康网
+党建网
+信息保护
+
+************
+
+llm model: Qwen/QwQ-32B-Preview
+hallucination times: 10
+total analysis time: 1539.9071581363678
+
+author and publish time(not formated): {'source': '人民网', 'publish_date': '2024-01-01'}
+infos(not formated):
+社区治理: 围绕建设农业强国目标,中国不断加大农机等科技创新和创新成果应用,农业装备和农业机械化水平实现了跨越式发展,加快向‘大中小型兼备、绿色高效智能一体’迈进。目前,全国农作物耕种收综合机械化率达74.3%,农机作业水平不断提升,社会化服务能力显著增强。
+社区治理: 辽宁,作为全国13个粮食主产省之一,源源不断地为“中国碗”提供优质“辽宁粮”。产业兴旺、生态宜居、乡风文明、治理有效、生活富裕,一幅乡村振兴新图景正在辽沈沃野徐徐展开。
+社区治理: 社区活动、社区课堂、居民活动、物业管理、业主自治、楼组建设、小区微更新、文明养宠、楼组长、团队建设、居委会标准化建设、美丽楼组、僵尸车、全岗通、小区充电桩、电动自行车、'五大委员会'工作、社区民主协商、一居一品、事实项目、社区治理效能、'四百'走访大调研、社区难点、社区痛点、赋能社区工作者这些方面的信息
+more urls:
+人事
+理论
+党建
+社会 · 法治
+教育
+京
+津
+冀
+晋
+蒙
+辽
+吉
+黑
+沪
+苏
+浙
+皖
+中央社会工作部
+学习强国
+旗帜网
+“人民消费”中消协教育课堂
+人民日报
+擦亮和美乡村幸福底色
+浦东首创居民自治金项目试点从居民区推向乡村
+民政部等三部门联合印发《乡村地名建设指南1.0版》
+湖北罗田回复网友:尽快优化并开通公交线路
+金台视线|让社区食堂实现可持续发展
+身边事|工地围挡长期未拆 影响通行
+建议|整治中小学周边游戏推广
+反馈|加大巡查力度 守护水域生态
+电动汽车供电设备强制认证将解决哪些问题和隐患?
+流感高发,如何预防与应对?
+司法“精耕细作” “滴灌”乡村田野
+千年古镇,法庭绘就新“枫”景
+广东东莞二院:法庭与司法分局联手化解租赁纠纷
+业委会换了,电梯更换还能继续履行吗?
+北京“守夜人”
+深圳龙华:客家古村焕新生
+免费场馆加量 健康生活加码
+落实防控指南 密集场所如何有效防控诺如病毒?
+千龙网
+华龙网
+齐鲁网
+红网
+天山网
+荆楚网
+北方网
+南方网
+中国残联
+中国小康网
+党建网
+
+************
+
+llm model: Qwen/Qwen2.5-Coder-32B-Instruct
+hallucination times: 2
+total analysis time: 369.2517011165619
+
+author and publish time(not formated): {'source': 'NA', 'publish_date': 'NA'}
+infos(not formated):
+
+more urls:
+社会 · 法治
+领导留言板
+强国论坛
+人民建议
+京
+津
+冀
+晋
+蒙
+辽
+吉
+黑
+沪
+苏
+浙
+皖
+闽
+赣
+鲁
+豫
+鄂
+湘
+粤
+桂
+琼
+渝
+川
+黔
+滇
+藏
+陕
+甘
+青
+宁
+新
+中央社会工作部
+学习强国
+人民日报
+中国城市报
+人民论坛
+人民周刊
+人民网研究院
+浦东首创居民自治金项目试点从居民区推向乡村
+党员学习园地
+电动汽车供电设备强制认证将解决哪些问题和隐患?
+业委会换了,电梯更换还能继续履行吗?
+北京“守夜人”
+深圳龙华:客家古村焕新生
+网站地图
+中国政府网
+中国文明网
+新华网
+央视网
+光明网
+中国日报网
+中国新闻网
+中国网
+千龙网
+华龙网
+齐鲁网
+红网
+天山网
+荆楚网
+文汇网
+北方网
+南方网
+东方网
+
+************
+
+llm model: Qwen/Qwen2.5-32B-Instruct
+hallucination times: 3
+total analysis time: 270.95306396484375
+
+author and publish time(not formated): {'source': 'NA', 'publish_date': 'NA'}
+infos(not formated):
+
+more urls:
+社会 · 法治
+领导留言板
+人民建议
+聚力微光
+闽
+赣
+鲁
+豫
+鄂
+湘
+粤
+桂
+琼
+渝
+川
+黔
+滇
+藏
+陕
+甘
+青
+宁
+新
+鹏
+中央社会工作部
+中国城市报
+人民论坛
+浦东首创居民自治金项目试点从居民区推向乡村
+2024网上群众工作大会|
+“我给两会捎句话”启动
+金台视线|让社区食堂实现可持续发展
+电动汽车供电设备强制认证将解决哪些问题和隐患?
+业委会换了,电梯更换还能继续履行吗?
+中国文明网
+千龙网
+华龙网
+齐鲁网
+红网
+天山网
+荆楚网
+北方网
+南方网
+中国残联
+中国志愿服务联合会
+中国小康网
+
+************
+
+llm model: Qwen/Qwen2.5-14B-Instruct
+hallucination times: 3
+total analysis time: 190.22732496261597
+
+author and publish time(not formated): {'source': '人民网', 'publish_date': 'NA'}
+infos(not formated):
+
+more urls:
+社会 · 法治
+领导留言板
+人民建议
+沪
+苏
+浙
+皖
+闽
+中国城市报
+人民论坛
+擦亮和美乡村幸福底色
+浦东首创居民自治金项目试点从居民区推向乡村
+民政部等三部门联合印发《乡村地名建设指南1.0版》
+办实事|立交桥下人行道及非机动车道常年积水 江西南昌:已解决
+2024网上群众工作大会|
+金台视线|让社区食堂实现可持续发展
+人民网记者遍神州
+电动汽车供电设备强制认证将解决哪些问题和隐患?
+业委会换了,电梯更换还能继续履行吗?
+
+************
+
+llm model: Qwen/Qwen2.5-Coder-7B-Instruct
+hallucination times: 4
+total analysis time: 102.63836908340454
+
+author and publish time(not formated): {'source': 'NA', 'publish_date': 'NA'}
+infos(not formated):
+
+more urls:
+理论
+党建
+经济 · 科技
+社会 · 法治
+国际
+军事
+港澳
+台湾
+教育
+科普
+中央社会工作部
+中国城市报
+人民论坛
+民生周刊
+国家人文历史
+人民周刊
+人民网智慧党建体验中心
+当前经济形势怎么看?
+解读2024年中央经济工作会议精神
+河南内黄:“冬闲”人不闲 增收致富忙
+擦亮和美乡村幸福底色
+浦东首创居民自治金项目试点从居民区推向乡村
+2024中国正能量网络精品征集展播活动启动
+中国过境免签政策全面放宽优化
+关于第九届全国道德模范候选人的公示
+外交部:欢迎外国朋友继续"种草"中国
+我国加快以标准提升引领原材料工业优化升级
+中美金融工作组举行第七次会议
+稳外贸、稳外资 明年工作这么干
+民政部等三部门联合印发《乡村地名建设指南1.0版》
+事关央企上市公司市值管理!国务院国资委出新规
+中国海警局新闻发言人就菲向非法"坐滩"仁爱礁军舰运补发表谈话
+我国成功发射航天宏图PIESAT-2 09~12星
+看点解析
+累计支持建设项目已达116个 智慧农业发展开启"加速度"
+办实事|立交桥下人行道及非机动车道常年积水 江西南昌:已解决
+湖北罗田回复网友:尽快优化并开通公交线路
+金台视线|让社区食堂实现可持续发展
+青海西宁:非遗唐卡“画”进高校课堂
+体育
+体育大看台 | 什么是垂直马拉松?
+“2024年线上骑行嘉年华”启动
+免费场馆加量 健康生活加码
+在中华饮食文化中品味健康之道
+新版目录将职业病调整为12大类135种
+落实防控指南 密集场所如何有效防控诺如病毒?
+防治心肌纤维化有了新途径
+美国
+英国
+俄罗斯
+韩国
+澳新
+网站地图
+中央纪委国家监委
+统战部
+中联部
+中央政法委
+中央台办
+中央编办
+中央党校
+中央党史和文献研究院
+全国人大
+全国政协
+中国民主促进会
+中国志愿服务联合会
+东方网
+人民文旅网
+中国小康网
+党建网
+人民日报社概况
+报社招聘
+招聘英才
+广告服务
+合作加盟
+供稿服务
+数据服务
+网站声明
+网络文化经营许可证 京网文[2023]4961-141号
+网络出版服务许可证(京)字121号
+京ICP证000006号
+
+************
+
+llm model: 01-ai/Yi-1.5-34B-Chat-16K
+hallucination times: 6
+total analysis time: 310.0613512992859
+
+author and publish time(not formated): {'source': '人民网', 'publish_date': 'NA'}
+infos(not formated):
+社区治理: 社区活动、社区课堂、居民活动、物业管理、业主自治、楼组建设、小区微更新、文明养宠、楼组长、团队建设、居委会标准化建设、美丽楼组、僵尸车、全岗通、小区充电桩、电动自行车、“五大委员会”工作、社区民主协商、一居一品、事实项目、社区治理效能、“四百”走访大调研、社区难点、社区痛点、赋能社区工作者
+社区治理: 辽宁,作为全国13个粮食主产省之一,源源不断地为‘中国碗’提供优质‘辽宁粮’。产业兴旺、生态宜居、乡风文明、治理有效、生活富裕,一幅乡村振兴新图景正在辽沈沃野徐徐展开。
+社区治理: 千年古镇,法庭绘就新‘枫’景
+社区治理: 构建‘快进快退’破产案件审判机制
+社区治理: 法庭与司法分局联手化解租赁纠纷
+社区治理: 青海西宁:非遗唐卡‘画’进高校课堂
+社区治理: 解决驻军部队难题
+社区治理: 建立军地互提需求、互办实事常态化工作机制
+社区治理: 科学制订‘病号食谱’
+社区治理: 谋定文旅融合,河南拥抱黄河大IP
+社区治理: 灯盏花,又名灯盏细辛,因花似灯盏、根似细辛而得名,有着‘滇南灵草’的美誉。
+社区治理: 人民日报社主办的2022中国品牌论坛在北京举行,本次论坛以‘推动中国品牌建设高质量发展’为主题,政府主管部门代表、企业负责人、专家学者齐聚一堂,开展深入研讨交流,为助推中国品牌建设汇聚智慧力量。
+more urls:
+党网 · 时政
+人事
+反腐
+理论
+党史
+党建
+社会 · 法治
+人民网评
+三评
+人民财评
+人民来论
+人民访谈
+人民体谈
+领导留言板
+强国论坛
+828企业服务平台
+人民建议
+“大思政课”云平台
+视频
+图片
+图解
+灵境·人民艺术馆
+聚力微光
+京
+津
+冀
+晋
+蒙
+辽
+吉
+黑
+沪
+苏
+浙
+皖
+闽
+赣
+鲁
+豫
+鄂
+湘
+粤
+桂
+琼
+渝
+川
+黔
+滇
+藏
+陕
+甘
+青
+宁
+新
+鹏
+雄安
+中央社会工作部
+工会新闻网
+中国侨联
+学习强国
+中共中央党史和文献研究院
+全国哲学社科工作办
+旗帜网
+人民日报海外版
+中国能源报
+健康时报
+讽刺与幽默
+中国城市报
+人民论坛
+民生周刊
+人民周刊
+人民数字
+人民网研究院
+人民慕课
+人民网智慧党建体验中心
+当前经济形势怎么看?
+解读2024年中央经济工作会议精神
+深入领会对经济工作的规律性认识
+本固枝荣:坚持和落实“两个毫不动摇”
+中国式现代化一个都不能少
+擦亮和美乡村幸福底色
+李强主持国务院第十一次专题学习
+公报全文
+专题
+浦东首创居民自治金项目试点从居民区推向乡村
+2024中国正能量网络精品征集展播活动启动
+关于第九届全国道德模范候选人的公示
+稳外贸、稳外资 明年工作这么干
+累计支持建设项目已达116个 智慧农业发展开启"加速度"
+办实事|立交桥下人行道及非机动车道常年积水 江西南昌:已解决
+金融赋能 托起幸福“夕阳红”
+马鞍山雨山区:“三中心”落地,“一站式”助企
+“毫厘”间练就“独门绝技”
+时习之
+知行
+故事
+一见
+跟着总书记学党史
+整治形式主义为基层减负工作平台
+党的二十大精神理论大讲堂
+2024网上群众工作大会|
+湖北罗田回复网友:尽快优化并开通公交线路
+金台视线|让社区食堂实现可持续发展
+身边事|工地围挡长期未拆 影响通行
+建议|整治中小学周边游戏推广
+反馈|加大巡查力度 守护水域生态
+人民网记者遍神州
+总书记的人民情怀
+开放谈:以创新引领数字贸易高质量发展
+延续回升态势 全年目标有望顺利实现
+这份方案促零售业创新提升
+我国避寒游、冰雪游南北竞相升温
+读懂“川菜热”背后的烟火中国
+电动汽车供电设备强制认证将解决哪些问题和隐患?
+科技
+生态
+喜看“三农”新图景:农业更高效 乡村更美好
+我国成功发射卫星互联网低轨卫星
+新研究揭示人类基因流动复杂历史
+中国核电在运在建规模升至世界第一
+流感高发,如何预防与应对?
+解锁人民网“梦幻灵境”
+“万商万品 万象焕新”百日直播行动
+业委会换了,电梯更换还能继续履行吗?
+让优质教育资源润泽雪域高原
+积极构建中国自主的教育学知识体系
+打造惠及世界的“幸福路”
+埃及专家:应对重重挑战 “全球南方”需要中国贡献
+汉语培训班为尼泊尔培养240名中文旅游人才
+发挥老兵余热 讲好国防故事
+第76集团军某旅评功评奖坚持公平公正公开
+新疆军区某综合训练基地科学制订“病号食谱”
+朔尔茨未通过联邦议院信任投票
+圣彼得堡举办马戏主题展
+和平力量相遇深蓝航道
+网联中国
+大河之南 兴起新文旅
+安徽省检察院举行开放日活动 代表委员建言献策
+贵州举行森林防火主题宣传活动
+“简牍学文库”项目启动暨编纂出版座谈会举行
+深圳龙华:客家古村焕新生
+文化中国行
+文艺星开讲
+免费场馆加量 健康生活加码
+在中华饮食文化中品味健康之道
+落实防控指南 密集场所如何有效防控诺如病毒?
+防治心肌纤维化有了新途径
+人民日报社社会责任报告(2022年度)
+《人民日报社论集(2017.10—2023.03)》出版发行
+人民网
+学习贯彻习近平新时代中国特色社会主义思想主题教育官网正式上线
+“跟着总书记学党史数据库”正式上线
+地方频道人员名单
+日本
+美国
+英国
+俄罗斯
+韩国
+澳新
+网站地图
+中央纪委国家监委
+统战部
+中联部
+中央政法委
+中央台办
+中央编办
+中央党校
+中央党史和文献研究院
+全国人大
+全国政协
+中国政府网
+中国文明网
+新华网
+央视网
+光明网
+中国经济网
+中国日报网
+中国新闻网
+中国网
+中国青年网
+中青在线
+求是网
+法治网
+中工网
+央广网
+国际在线
+中国军网
+中国台湾网
+中国西藏网
+未来网
+千龙网
+华龙网
+齐鲁网
+红网
+天山网
+荆楚网
+文汇网
+北方网
+南方网
+中国残联
+中国文联
+中国作家网
+中国民主促进会
+中国志愿服务联合会
+东方网
+人民文旅网
+中国小康网
+党建网
+人民日报社概况
+报社招聘
+招聘英才
+广告服务
+合作加盟
+供稿服务
+数据服务
+网站声明
+
+************
+
diff --git a/version b/version
index 03f2afa..759e411 100644
--- a/version
+++ b/version
@@ -1 +1 @@
-v0.3.5
+v0.3.6
\ No newline at end of file