README.md 710 Bytes
Newer Older
mashun1's avatar
omnisql  
mashun1 committed
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
# 程式化自然语言问题合成

这是我们数据合成框架的第三步,专门用于为合成 SQL 查询生成风格化的自然语言问题。

## 第 1 步:问题生成

生成风格化的自然语言问题

```bash
# 创建用于生成问题的提示
mkdir prompts
python3 generate_question_synthesis_prompts.py
```

```bash
# 为合成的 SQL 查询生成问题
mkdir results
python3 synthesize_question.py --model model_name --base_url vllm_serve_url(http://x.x.x.x:8000/v1)
```

## 第 2 步:后处理

```bash
# 执行以执行语义一致性选择,确保生成的问题与其相应的 SQL 查询紧密一致
export HF_ENDPOINT=https://hf-mirror.com
python3 post_process_questions.py
```