福报
playwright 也刚开始用,以前 cypress 用得多点,跑用例飞一样的感觉。
但感觉未来还是 playwright 的天下,因为他也很快,并且支持多语言,多浏览器,还自带并行执行,web 测试首选
确实,体验下来,感觉这类大模型的自动化始终存在两个问题不适合在 CICD 中使用
我是自己部署的 deepseek,跑起来没问题的
你是用 deepseek 官方的 api,还是自己部署的 deepseek 哦?我看 stagehand 底层用的 litellm,可以参考这个配置使用官方 api: https://docs.litellm.ai/docs/providers/deepseek
如果是自己的部署的,模型名字前面加 litellm_proxy/
这是他文档里面写的。这里指的是自己部署的模型,不是各个官方渠道的公共模型
看官方文档说只支持 TypeScript 配置自定义模型。试了一下 Python 也能够设置自己的模型,只是有点 hacky
config = StagehandConfig(
env="LOCAL",
model_name="litellm_proxy/custom_deepseek_model_name",
model_api_key=os.getenv("MODEL_API_KEY")
)
stagehand = Stagehand(config)
stagehand.llm = LLMClient(
stagehand_logger=stagehand.logger,
api_key=stagehand.model_api_key,
default_model=stagehand.model_name,
metrics_callback=stagehand._handle_llm_metrics,
api_base="https://opt.mydeepseek-inc.com/deepseek/v1/",
**stagehand.model_client_options,
)
按说指定了 utf8 不应该再提示 gbk 编码问题,是否有其他地方的代码在读文件,仔细看看完整的 stacktrace 看是否是这一段代码报错的呢。或者单独把这一段拿出来运行试试。
跟帖
看错误提示不是 gbk decoder 在解析文件吗。是不是 csv.read 也需要设置编码哦
各种环境异常的用例更像是稳定性测试用例的范围
又清晰又全面,赞~
后台持续占用,直接 traceview 拉一把 trace 不就知道了吗