我在 Linux.do 的文章

【富可敌国】分享自己写的一个 MCP WebSearch 以及 Get Content,可以用来代替CC官方的WebSearch

之前的帖子: https://linux.do/t/topic/1953647 https://ooooooooooooooosearch.wwwneo.com/mcp wsm_zw7KB3a5HxwbDLj7Mv3W_hy1xizWKvH4Zw49QKsqGh8 恢复了,性能会好一点,最近可能偶尔重启服务,在优化获取页面内容相关的部分。 单次响应已经能保持在10秒以内,包含冷启动,欢迎佬们反馈。

🔗 linux.do
SGlang A2x4 部署 DeepSeekV4 Pro 交流帖【后续放测试报告。】

Sglang vs VLLM 吞吐差异。 Sglang 针对910b2集群模型支持情况,目前看到的是W8A8类型,好像不支持w4a8。 GLM5.2-SGLANG-W8A8 初步测试

🔗 linux.do
【富可敌国】 真的公益,我们在寻求一些方案,一起聊两句?

测试站 绝对不会收集各位的key信息,只是想看看谁有问题。 排行榜(模糊处理域名) Q1:是否需要针对模型进行单次请求的编程检查,使用sandbox进行运行代码,来进行打分呢,作为检测条件呢。 Q2:针对Anthropic使用那种检测手段是大家最关心的,或者说是更关心什么能力。 Q3: 针对GPT(当前GPT价格已经很低了)那么大家更想关注什么呢。 只要你有想法,想一起做一些公益的事情,都可以进行回复内容,我们会仔细阅读。

🔗 linux.do
【富可敌国】中转站检测,绝对中立,手中有中转的小伙伴可以来测试了,请各位监督 Claude 1:1镜像检测第二弹。

兄弟们我们看看谁在搞事情。 绝对不会收集各位的key信息,只是想看看谁有问题。 测试站 排行榜(模糊处理域名) 在说一次 ,永远不收费,也不会卖api,接受监督,公益服务已经关闭了,改到自用了。 网站上面有群聊,可以进群里看看。 阶段性报告(已经测试2000+) 部分渠道 将input 进行放大,最高的37倍 部分渠道 发送简单的提示词也会命中缓存(没有创建缓存,例如发送一个97token的文本,返回提示缓存命中了1w~3w tokens 不等。) 你现在必须要做的事情 使用CURL发起简单的请求,看一下input 与 缓存命中,可能10次出现一两次,也可能10次全部出现大量缓存命中,这种在每次都是新回话的时候不应该出现。 当前我在做什么 买了一个DGX Spark 跑破限模型进行针对被测试的模型进行持续追问,检测一些合规的部分。 使用官方Key进行持续后台采集对比差异,让分数更加准确。 我们提供公益的API进行检测,禁止贩卖,有需要的佬友可以找我,IP白名单的形式,禁止海外IP。

🔗 linux.do