这个方案其实很早就有人提过了,但是网上找了一圈很少有人总结一个 SNI 伪装(SNI 前置?)的规则列表,大部分都是 gfwlist,只是被墙网站的列表
test1 发布的帖子
-
RE: 使用 chrome 浏览器 SNI 伪装免代理上部分 GFW 被墙网站(更新规则文件和启动脚本)
-
RE: 使用 chrome 浏览器 SNI 伪装免代理上部分 GFW 被墙网站(更新规则文件和启动脚本)
上述 Github 仓库里脚本的备份
新建一个文件夹(比如名称就叫做 GFWSNIRules),解压以后在这个文件夹启动start.py
即可(需要手动修改里面 chrome 的文件路径);rules.json
是规则文件。第一次访问某个网站记得加上https://
前缀Enjoy!
-
使用 chrome 浏览器 SNI 伪装免代理上部分 GFW 被墙网站(更新规则文件和启动脚本)
前文:#224 - 使用 chromium 浏览器的 host-rules 命令行(目前)免翻墙上 pkuanvil.com 以及部分 SNI 阻断的网站
搞了一个简单的启动脚本,只需要浏览器和规则文件就可以使用,不需要代理等上网方式,可以在中国大陆直连一小部分网站(包括
github,reddit,web.archive.org,wikipedia.org,torproject.org
等等,至少目前能上)
这个方法使用的网站不多,需要网站本身不严格校验SNI,而且一般网站的不同子域名不一定部署在同一个CDN上。而且即使能直连,IP地址本身能否连上如何也是问题。不过对于能连上的那些就很有用了,对环境要求很低,只需要一个基于 Chromium 的浏览器 -
RE: 本站latest有rss吗
点击 https://www.pkuanvil.com/recent “最新”右边那个广播小图标就能看到,注册用户的链接里面会增加两个参数 uid 和 token
-
RE: 本站latest有rss吗
游客的 rss 链接:https://www.pkuanvil.com/recent.rss
这个链接不能使用任何用户设置里面的过滤选项,只有注册用户才能使用 -
RE: 为什么游客发帖要需要手工approve?
作为站务我能考虑到的是pkuanvil不是未名树洞,这一点很多用户都不愿意接受(很多游客发帖是已注册用户的马甲)
这个说起来就复杂了,作为站务我也不知道怎么处理…
但是完全允许游客发言是不太可能的,允许游客发言本来就是临时措施 -
RE: 为什么游客发帖要需要手工approve?
这会引入额外成本,首先我不认为需要为游客发帖付出这么多成本(开通openai帐号本身就是成本) 而且如何向gpt解释审查标准也是一个问题
-
RE: 为什么游客发帖要需要手工approve?
因为游客发言的下限太低了。导火索是有bot往#435这个帖子里面刷假药广告
如果注册用户发类似帖子会视情节轻重补刷屏tag,给警告或禁言等等,但是游客的话这些都没有意义,因为bot它不会理解站务说的任何话,就是直接删帖对游客默认信任是不行的,因为站务也不是AI,能24小时在线绝对不会误伤正常发言,站务不在的时候出什么事都有可能,而注册用户大量灌水发垃圾贴的概率就低很多
-
RE: Anna’s Archive 正在寻找 LLM 公司提供 359TB 中文非虚构类图书的高质量 OCR 扫描
示例页面
为了证明您有良好的 OCR 处理流程,您可以从以下的来自一本有关半导体的书的示例页面开始。您的流程应当正确处理数学,表格,图表,脚注等等。
将您处理好的页面发送到 AnnaArchivist@proton.me 。如果它们看上去良好,我们会私下向您发送更多页面,并且我们期待您能够在这些页面上快速运行您的流程。当我们满意的时候我们就能达成协议。
-
Anna’s Archive 正在寻找 LLM 公司提供 359TB 中文非虚构类图书的高质量 OCR 扫描
Anna’s Archive 获得了754万本/359TB 来自读秀(超星电子图书馆)的电子书。读秀的这些电子书已经在中文互联网上长期盗版,被二次销售时通常低于1美元。即使如此,大批量地获得这些书是很难的。Anna’s Archive 一直将这放在TODO list上,并分配了好几个月全职工作在这方面。
不过,有志愿者联系了 Anna’s Archive,表示他们以高昂的代价已经获得了这些书。他们分享了收藏的所有书给 Anna’s Archive,没有索取任何回报,(当然)条件是要长期保存这些书。他们同意在将这些书 OCR 的过程中寻求帮助。
Anna’s Archive 正在寻求来自 LLM 公司或学术机构的帮助。高质量的学术图书非常有利于 LLM 的训练,尽管这些书是用中文写的,但无论源语言是什么,模型都能理解概念和知识。Anna’s Archive 愿意给予您一年的大规模独家访问权限。如果您愿意与我们分享整个流程的代码,我们愿意将该收藏品禁运更长时间。当然,在禁令失效以后 Anna’s Archive 会发布整个收藏。
-
RE: 使用 HTTP Piping Server 做通用的 TCP 内网穿透/反向代理
另外 piping-server 的一个问题是 /aaa 和 /bbb 等等 URL 每次只能一个 TCP 入站/出站连接配对,即不能多个 TCP 连接都连接到 /aaa 和 /bbb。这个可能会让部署略显复杂,需要更精巧的脚本去自动生成这些 URL 避免冲突,而且还需要 Server 端主动监听这些 URL(各种内网穿透的方案都需要被穿透方主动配合,因为 piping-server 或者 frp 都不能主动对被穿透方发起 TCP 连接)
-
RE: 使用 HTTP Piping Server 做通用的 TCP 内网穿透/反向代理
需要和基于 frp 的方案做更细致的比较。比较明显的一个优势是 HTTP 服务器可用性更高,特别是大量 CDN 都只支持 HTTP
-
使用 HTTP Piping Server 做通用的 TCP 内网穿透/反向代理
原文:Secure TCP tunnel from anywhere with curl and nc for single connection(原理介绍)
(另一篇文章 The Power of Pure HTTP – screen share, real-time messaging, SSH and VNC 举了大量浏览器前端中实现 ssh、屏幕共享、VNC的例子,没有讲述原理,但是这种基于 HTTP 的 TCP 管道式代理方法本身不仅限于浏览器中使用)
Github 项目:https://github.com/nwtgck/piping-server原理不复杂,就是用 HTTP 转发 TCP 流量。这个只需要 HTTP 服务器就可以用(绝大多数 CDN 都只支持 HTTP)
举例:假设 https://ppng.io 是部署了原文所说的 piping-server,在自己的 Server 上(比如在 22 端口启动了 sshd),使用如下命令启动入站和出站 TCP 隧道:
# server host curl -sSN https://ppng.io/aaa | nc localhost 22 | curl -sSNT - https://ppng.io/bbb
然后在要自己的 Client 端,使用如下命令启动出站和入站 TCP 隧道:
# client host curl -sSN https://ppng.io/bbb | nc -lp 2222 | curl -sSNT - https://ppng.io/aaa
最后在 Client 端连接到本地的 2222 端口:
ssh -p 2022 root@127.0.0.1
中间使用了辅助的命令 curl 和 nc 作为 TCP 流量管道。
Server 端:
curl -sSN https://ppng.io/aaa
:让 curl 从https://ppng.io/aaa
读取输入,安静输出(-sS
)并流式(-N
)输出到 stdout(Server 监听 /aaa)nc localhost 22
:将上一步的输出管道接到 Netcat 并发送到localhost
的 22 端口curl -sSNT - https://ppng.io/bbb
:将上一步的输出管道接到 curl 并上传(-T
)到https://ppng.io/bbb
,流式(-N
)安静输出(-sS
),中间的-
表示从 stdin 输入(Server 返回结果到 /bbb)
Client 端:
curl -sSN https://ppng.io/bbb
:让 curl 从https://ppng.io/bbb
读取输入,安静输出并流式输出到 stdout(Client 监听 /bbb)nc localhost 22
:将上一步的输出管道接到 Netcat,同时让 Netcat 监听(-l
)本地的 2222 端口curl -sSNT - https://ppng.io/bbb
:将上一步的输出管道接到 curl 并上传到https://ppng.io/bbb
,流式安静输出,中间的-
表示从 stdin 输入(Client 发送请求到 /aaa)
上面两步只是建立了 TCP 流量转发流程,并未真正启动 ssh 会话,最终的 ssh 会话由 ssh 客户端启动:
ssh -p 2022 root@127.0.0.1
整个流程图示如下:
---------------------------------------------------------------------------------- | [Client] | https://ppng.io | [Server] | |--------------------------------------------------------------------------------- | (Client TCP Upload) | | (Server TCP Download) | | ----> ---> curl ---|--> /aaa ---|--> curl ---> ----> | | ssh nc | | nc sshd | | <---- <--- curl <--|--- /bbb <--|--- curl <--- <---- | | (Client TCP Download) | | (Server TCP Upload) | ----------------------------------------------------------------------------------