2024-08-27
llm
0

json_repair

修复 LLM 输出的 json

https://github.com/mangiucugna/json_repair

pip install json_repair

repair_json()

python
from json_repair import repair_json, loads bad_json_string = '{"a": 1' good_json_string = repair_json(bad_json_string) print(good_json_string) # '{"a": 1}'
2024-08-27
python
0

jsonpath

https://jsonpath.com/

功能JSONPath符号XPath符号描述
根节点$/访问JSON或XML的根节点
子节点./访问当前节点的子节点
所有子节点**访问当前节点的所有子节点
数组索引[n][n]访问数组的第n个元素
所有数组元素[*]*访问数组中的所有元素
合并操作符[,]访问若干个元素
切片运算符[:]访问若干个元素,左闭右开
递归下级..//访问当前节点及其所有子孙节点
过滤条件[?()][condition]根据条件筛选节点

返回的结果均为数组

示例

2024-08-09
爬虫
0

https://github.com/scrapy/w3lib

pip install w3lib

w3lib.url

canonicalize_url(url, keep_fragments=False) 规范化 URL

  • 排序 URL 中的参数
  • 标准化 URL 的大小写
  • 删除结尾的无效内容
2024-06-25
other
0
2024-06-25
llm
0

推理参数

temperature

该参数用于控制生成文本的随机性和多样性,其实是调整了模型输出的 logits 概率分布

  • temperature 较高时,会更平均地分配概率给各个 token,这导致生成的文本更具随机性和多样性
  • temperatur 较低接近 0 时,会倾向于选择概率最高的 token,从而使生成的文本更加确定和集中
  • temperature=1 时表示不使用此方式

top_k