[站务] 猫の仓库 全站存储已升天,请待恢复
置顶
2025-02-01 [ 上次更新于 1 周前 ]
1.7K 7 2条评论
此置顶帖内提到的各种事项、项目计划、说明等,之后会重新总结添加到帮助页面中。
但是因为还有很多事情没有忙完,所以先记在这里,各位就当这里是一些我闲的没事时候写的一些闲聊好了。
以下为,2025年4月的公告内容。
本站目前维护的2个E5管理员账号 SharePoint 日前均已暴毙,全站除磁力分流、BD盘分流外其余存储位置均已失效。
此事是早有预感了,几个月前我对网站的下载流量新增了监控功能,继而发现一些用户经常在一天内下载1TB以上的文件,因为E5的限流到顶每天是2TB,经常触发这个上限账号是必然保不住的,暴毙并不意外,但是并没有补救方案,只能等着暴毙发生。
所以目前的网站订阅已被暂停,订阅入口已移除,之后恢复网站功能时的补偿措施和上一次一样,会为所有历史用户重置一次订单有效性,如有必要请妥善保存自己的订单记录。
也懒得追究我是不是被当成羊薅了,这没什么意义,于是接下来我需要重新计划方案转移存储,所以目前有两个思路:
第一种是转移服务基于正价 microsoft E3 / 正价 google WorkSpace 或者直接基于 Wasabi 和 Backblaze 等对象存储服务提供网站下载,这会导致订阅本网站所需价格飙增。
第二种是继续考虑减配,网站将放弃一切可用性承诺仅上传一两个网盘且不维护,以及网盘上传需要进行双层压缩,这会势必会极大降低各位的下载体验。
然后是有关这两个思路潜在的问题:
猫の仓库是一个“归档”类型的网站,这个类型的网站特点是需要巨大的存储空间同时下载流量并不高,所以基于对象存储提供服务时成本比较难以预算,我花了大约半天时间拉了一下表,总之以本站目前的归档规模(10tb)计算,不考虑维护的使用S3存储成本大约每年需要支付差不多1300刀使用其他例如R2存储筒或者B2存储筒的价格会低300-400刀,相比之下正价E3和正价WS更划算些,但也需要每年支付差不多700刀。
当然了,坦率讲由于我本人的收入水平常年一年不如一年,上述的成本都不是我能够接受的,猫の仓库之所以会发展出目前这种5R/月的扭曲订阅形式本身就是我无力承担本网站成本的一种非常具体的扭曲……所以基于上述的成本计算,本站的收费需要采取例如只能按年订阅等更加扭曲的订阅形式,不然如果按月计算那么人均下来就太高了。
然后是对于上网盘的问题,本站从来不上网盘的核心原因是我太忙了,毕竟人这种动物还是太脆弱了,几天不吃饭就要死了……而网盘就也是个脆弱的东西,如果维护网盘意味着我需要花大把的时间上传、备份和补档,同时也意味着我需要在这些额外花费的时间上找饭辙,也是一根的筋和两头的堵。
于是赛后总结环节,和往常一样,随便聊聊。
说实话许多年来本人从不认为自己是个职业站长,因为一般来讲得能指这个行业吃饭才算是职业是吧,猫の仓库这网站作为我这辈子众多赔本买卖里排名甚至还比较靠前的,爱情的含量还是不低的。
既然是爱情那就肯定会有保质期,平行世界一下,这网站如果作为我的一个业务,那我大概需要玩的花活可能就不止订阅这么扭曲了,起码本站的帖子会变成自动发布的,然后会一步一步变为广告是两排三排还带弹窗的,注册是邀请的,链接是回复可见的,下载是需要用积分的,会员是298的,分销返利是20%的。
众所周知, 我作为一个“干净互联网”教派是长期批判这些东西并且致力于抵抗这些东西的。猫の仓库最初就是因此诞生的,同时这也是一切扭曲的根源。
毕竟都这个年头了,我完全能理解任何人对于“下载速度就应该跑满带宽”、“视频就应该没广告”、“推荐算法就应该精准”、“所有事情就应该点一下确认就能全部完成”以及诸如此类事情的需求以及正当性。
现在条件是好了我知道,家里宽带起手有个500M很正常,点开购物软件商品页面下面肯定有个客服图标里面马上有人回应你,道理是这个道理,但是这些需求在这个网站做不到确实也是做不到,以前、现在、未来都做不到。
因此你可以看到这个神奇的垃圾网站长期处于一种又肝又摆、又好又烂、又吵又静的仰卧起坐状态。这个事情要说的话其实也简单,毕竟UP主之类的自媒体做久了很少有San值检定一把过的……
尤其这一类事情真的非常难以和任何人去解释,因为绝大多数情况下甚至我都找不到解释的起点在哪,甚至比如说百度网盘那个文件详情页面应该点“下载”而非“在线打开”。当然了,这种问题本质上其实类似于“如何在电脑上正确的下载Steam”,我说这个不是为了嘲讽,相反,这种问题我认为本质上是一种“代沟”,而代沟的产生往往是由于每个人收集信息的渠道并不相同,这也是猫の仓库长期致力于实现标准化归档的意义,我期望通过系统的文件校对流传于互联网各类乱七八糟资源形成某种标准样本,帮助各位实现统一的阅读体验和更系统性的了解,从而使更多的人不必要在一些诸如一些扣扣群里流传的神秘小链接之类的信息茧房里打转,也没必要对这些资源贩子奉为上宾。
那么话又说回来,我得承认猫の仓库的项目管理是非常失败且特别失败的,理论上,猫の仓库至少应该拥有一份事无巨细且完善的使用文档,应该有更全面的内容截图、介绍、说明,并且整体覆盖的内容类型应该更广泛,而实际上,猫の仓库只是一个内容推荐的博客罢了,这项过于伟大的事业依然任重道远,甚至更远,此时的我已然在考虑这网站的营业潜力了。
但是猫の仓库的营业潜力显然是不高的,市面上任何类型的网站,往往是那种模板批量出来的文章、和各种套路引流的网站才有钱赚,这合乎人性,毕竟人是抗拒选择的嘛,谁能铺满所有选项那么谁就是王者。具体到本网站这一类型,我一般给咱这个类型的网站统一称之为“二次元小黄网”,这个类型的网站有一个特点,就是简陋的同时花里胡哨,这种类型网站绝大多数最初都是由某个闲得无聊的大学生捣鼓出来的,然后随着时间的推移一步一步质变成各种SSSSVIP网站,或者随着大学牲进化为牛马而消失在互联网。
当然,本站不太一样的地方是这网站最初成型是我为了备份我发布在贴吧和一些论坛的资源帖子所以搞了个免费的虚拟主机,按着教程上传了一个叫什么忘了但是长得很像扣扣空间的网页程序,后面才慢慢学会怎么用Linux学会编程甚至如今靠着做Web开发还没饿死,而我发布资源帖子这事甚至在我刚学会上网的时候就在干了,甚至至今我帖子的内容风格都没什么很大的变化,我那时候和现在一样,也会给旮旯GAME写一大段锐评然后附上下载链接。
不过眼下本站面临的困境倒是卡在我自己这一关了,毕竟当初的热情硬要说的话许多年前早已燃尽了,而Web开发行业蒸蒸日下的状态又很容易让我自动把主意打到这个网站上来,事到如今既然我已经无力维持这个网站那么再次关站跑路显然是比较体面的方式,而我又并不想放弃这块努力经营过的风水宝地,所以就有了这新增几千字的长篇累牍。
一方面,我并不认为猫の仓库所提供的功能值得更高的价格,另一方面,初心就在那里,我还没想好要把它卖个什么价钱。
人嘛,被生活把玩的久了,也是会包出浆来的。不改变的,终究难以存活,但是坚持自己好的方面总是没有错。
决定如何,我得先想想。
以下为,2025年2月的公告内容。
为猫の仓库2025年的维护计划,
- 本站的补档问题将着手解决,我计划使用3个月左右时间对本站过去两年多的全部文件进行分批校对和重新上传。
- 本站的内容更新接下来会恢复,但以一些之前就已经整理完成的内容和一些推荐为主,一些依赖于大量批处理的工作目前暂时无法开展。
- 本站的主站程序历经时长两年半的练习,现已发布首个生产版本,今后将不会大改了。
- 本站的整套订阅系统功能将重新修订,在文件库补档工作全部完成后,初步计划是月票改年票,除此之外本站依然会照常提供BT等多种方式分流。
以及猫の仓库站长本长对于本站项目维持至今的一点 New Type,
由于本站的文件库目前实际上完全依赖于Onedrive,出于e5账号用的越久越容易猝死的担忧,所以接下来会实行分离存储,弃坑或者已经维护完整不再更新的资源接下来将会转移到百度盘/pikpak/BT分流,一些正在更新中的资源保留在Onedrive同时保留我本地的备份,这样维护起来会比较方便,并且能更有效利用我有限的存储空间,也不会因为任何一个网盘账号出现意外导致损失全部存储。
对于更新事项,由于本站的文件库实际上是依赖svn进行版本管理的,经过了两年多之后已经存在了巨量冗余数据,最近这几个礼拜我主要干的事情就是重新给里面的数据重新按单项整理出来,至于接下来,我计划吸取一些现实物流系统的经验,简单来说就是给每个文件包设计一个识别码然后基于数据库管理这些文件,想法是有了目前还没有实现,这个是接下来对于本站自动化维护文件库的主要设计方向。目前的工作计划大概是这样,我准备先把站内一般向资源搬到百度盘,上个月的时候网站所有的BT分流已经上传完成,除了这部分之外目前还剩下一些还没整理完成的文件,会随着文件库分流重建过程进行,已经校对完成的部分会暂时放到我提供的 Fopun 节点上,已经有BT的我推荐优先下BT,实在不行 Fopun ,虽然 Fopun 速度慢,实在不行可以通过站内网盘,网盘会快一些,只是每天会限流,各位自己选个喜欢的就就是了。
本站的Web页面目前已然完成了我在三年前对于这个项目的全部设想,当然我这个设想的全部其实本来就不复杂,主要来说就是足够精简并且功能上接近主流站点,但是因为在五年前我也没干过正经的Web开发,两年前我也没干过正经的前端,所以实际上这两年半大部分时间都是走弯路去了……但是系统设计毕竟是个复杂的事情,一些大家平日里在大厂app里司空见惯的功能啊之类的,放到个人项目上实现难度就会成倍增加,就算是目前,我也只是实现了网站该有的一些基础交互,然后做了一套API用于自动化的控制网站发帖和文件上传,也就这样了,反复重构肯定是没什么必要了,之后就是考虑给网站加些论坛之类花里胡哨的功能。
对于本站的订阅系统的一些问题,得益于本站的订阅价格实际上也不是很高,也就造成了本站的客服投诉率长期居高不下。我能认识到这个问题,但是很显然我也没准备解决这个问题,由于本站实际上是个博客并且是对内容质量有一定追求的博客,我确实也没把精力放在军事上(bushi),毕竟一天都是24小时,我要干的事情又太多了,所以提价应该是最有效的办法。理论上,关注越少能力越小,能力越小责任就越小,增加钱包检定强度是更进可攻退可守的方案,一方面加钱可以让我用更加work的方式解决各位的问题,另一方面毕竟本站的长期运营目标也就期望回收一下成本,包括做种服务器在内成本一个月大约四百多几十,仅从实现角度考虑的话网站每个月新增4个用户显然要比每个月随机维系40个用户容易的多。当然了,订阅之所以是订阅主要取决于各位对我工作的满意程度,包括分流方式在内的事项不会更改,虽然照理来说一个网站活的越久吃相越丑其实是个很正常的事情(这个过程我们一般有个通俗易懂的叫法就是提纯),但是本站显然罪没必要至此,如果有可能的话,或者说能凑到足够的人摊平成本咱可以一起整个emby服务器之类的来玩,不过凑人这个事情倒是也不用期待,毕竟我个人这个号召力确实也约等于无。
总之就总之一下吧,由于这段时间以来本站正在试图整套的替换原先的文件库保存方案并且毫无成效,于是接下来一段时间我的主要工作会是手动检查所有文件并且重新上传,考虑到本站运行和维护长久以来始终以开放的心态面对变化,并且随时一拍脑门,主打一个目标没有导向,但是这也并不妨碍本垃圾网站就这么蹦跶了七年。
于是,猫の仓库七周年快乐~
以下为,2025年1月的公告内容。
当前的页面使用了更现代化的Alpinejs和Tailwindcss构建,主要期望是按照现今APP的开发模式把一些交互逻辑放到前端实现,以解决之前组件加多了之后全是垃圾代码导致制约了页面的功能拓展。
与之前不同,这次大工程动手之前我专门花了点时间设计了一下页面路由和拓展机制这些比较主要的部分,算是搞得专业了些,作为猫仓长期维持计划的一部分,本站当前的WP程序模板在完善一些之后会单独作为本站的一项收入来源单独出售,不过现在说这个还有些早,按计划之后大概还需要大概滚动10-15个版本更新才能算是正式版,至少是两三个月之后了。
目前的“重制重制重制版”总体代码量大概刚刚好一万行左右,照比之前我这个项目单网页程序就已经干到快五万行了。不过这个事情,我之前就是信了一些“复用越少BUG越少”之类的邪教,结果就是陷入了一种改来改去改不明白的状态,总的来说还是得先给程序结构规划好,思路对全都对,这项目我彻底决定重写之后,总之睡眠质量也好了很多。
而屎山越堆越大这件事制约的也不单是页面,如我之前所说,本站的运行依赖着巨大的一整套自动化工作流脚本。所谓当断则断,我裁撤了本网站运行所依赖的大部分执行脚本和服务器,包括整套的版本管理器、索引程序和数据库、压缩包自动打包&上传脚本、以及自动发帖程序。
于是这是本站目前停更状态的主要原因,自动化工作流的部分是我这个项目的另一半,因为这部分脚本实际上是我早年间刚开始学习python时候的产物,虽然后来这么久一直在修修补补删删改改的用到了现在,但是毕竟硬伤永远是硬伤,比如文件分拣吧,我当时做了一个字典来匹配关键词,但是方案用的是递归,因为文件类型很多,所以后期我陆陆续续在里面写了大概一百多次的if嵌套……但是现在毕竟是2025年了,解决这个问题其实随便找个大语言模型调一下API辅助识别就可以了,完全不需要像我这样搞这种人机工程学难题。
在上周完成了站点程序的更新之后,最近这段时间我在尝试重写这个工作流项目,把功能的部分拆的碎一点,毕竟本站的文件来源主要是其他网站,文件处理需要的步骤也并不完全相同,设计成可以根据不同的文件类型和来源写一个单独的规则,这样会比较灵活,就不至于每一组文件都在整套的脚本里走一遍了。
后面我会尝试利用一下大模型去处理一些复杂的分析,比如我有好多没有名字的本子,普通OCR对于花体字的识别很差,但是如果用大模型识别就会准确很多,有了名字就可以上搜索引擎去尝试恢复文件信息了,新的时代松鼠党人也是时候升级一下工具链了。哎,总之感谢deepseek让我用上了便宜的GPT……
剩下的一些计划可能就需要取决于本站的开发进度了,本站计划在之后提供新的赞助方案,其中会包括本站维护策略的更改,从年后开始,本站将逐步提供度盘链接分流。同时本站接下来将通过本站的令牌系统提供一些额外服务,不过这个暂且卖个关子。
最后就是咱这个网站什么时候开始恢复更新呢,一些必要问题目前我还没有解决,主要是本站的文件库,我曾经很多次讲过网站的文件库非常巨大,维护困难,这个困难具体来说是这几TB的文件需要保持其他人可访问的状态,但是我又燃烧不起流量成本。不过这个解决起来方法其实简单,广撒网就对了,提供的下载方式越多文件就越有保障,所以这段时间我在重新整理网站的文件,接下来除了将一部分文件转移到其他方式提供下载,我计划在之后额外提供一到两个其他的网盘(取决于上传进度),以及提供单独的单文件索引和下载(但是并没有提供在线版的计划),Fopnu客户端目前是失联状态,会在之后我完成整理之后恢复提供,实在不行,别的方案也有,例如我单独提供针对本站维护磁力链接的私有Tracker,毕竟现在的BT环境非常差劲,不上点科技狠活确实也没什么太好的办法维持。
其他的事项,倒也没什么了,更新计划之类的,去年时候就已经讲过,这里就不重复讲了,就刚刚说到的一些事情,一时半会也干不出来,测试程序和方案也得花时间,总之还是那句别急。
那就,新的一年,祝大家新春大吉万事如意平安喜乐福寿康宁吃好喝饱前途似锦来日方长万事可期有山可靠有树可栖一路繁花前程似锦。
新年快乐嗷。
本网站不提供任何下载服务,请不要询问如何下载。文件列表如有缺少文件、文件不一致、需要更新&勘误、链接失效、等任何问题、请于下方留言。猫の仓库温馨提示:适度色色益脑,沉迷色色伤身。合理安排手冲,享受健康生活。
真的要把llm的识别结果接到自动化pipeline吗 不可控的输出恐怕更粪()时不时来点预料外的前后缀
一般会直接告诉模型一组选项,让它从中选一个符合的,或者从一段文本中提取某一个信息。虽然这样也不见得稳定,但是反正最后都要人工校对,我倒是认为问题不大,不然自己训练模型更摇头(