维基百科:机器人/申请/Cewbot/18

最近因为规范变严格了,所以有些页面也出现问题,必须清理。基本上这边会从高优先度的开始尝试,然后再往低优先度的去处理。这个维基语法清理任务已经在中文以及日文维基上跑了好一段时间了,这次扩展到对于Special:LintErrors的清理。记录见User:Cewbot/log/20151002。 --Kanashimi留言2017年10月11日 (三) 09:43 (UTC)[回复]

您要先清理哪一个?我觉得应该一项一项分别来审核会比较方便。--A2093064#Talk 2017年10月15日 (日) 07:04 (UTC)[回复]
先清理Special:LintErrors/bogus-image-options吧。 --Kanashimi留言2017年10月19日 (四) 09:06 (UTC)[回复]
所提供的纪录应该还没有执行清理LintErrors的纪录吧?那说明一下有问题的档案选项要怎么处理,是全部移除、还是有特别处理方式?--A2093064#Talk 2017年10月19日 (四) 11:03 (UTC)[回复]
这边只会针对有问题的部分,删除重复的档案选项,尝试修复档案选项(如130转成130px),略过不能处置的。 --Kanashimi留言2017年10月19日 (四) 13:02 (UTC)[回复]
我希望了解对于不同的错误个别的处理方式,您可以展示code或是列于这里,或者在测试编辑展示,看您要哪种方式。--A2093064#Talk 2017年10月20日 (五) 12:42 (UTC)[回复]
请见Special:Diff/46639754, Special:Diff/46639667, Special:Diff/46639664, Special:Diff/46639637, Special:Diff/46639626。这几笔原先都在Special:LintErrors/bogus-image-options中,经过修正后就消除了。 --Kanashimi留言2017年10月20日 (五) 13:01 (UTC)[回复]
这笔是属于“删除重复的档案选项”对吧?那么这笔呢?--A2093064#Talk 2017年10月20日 (五) 13:15 (UTC)[回复]
Special:Diff/46639626这一笔属于删除无效选项,有效选项请参见en:Help:Files, en:Wikipedia:Extended image syntax。 --Kanashimi留言2017年10月20日 (五) 13:28 (UTC)[回复]
其实硬要说全部都是无效选项,不过交给机器人清理就需要想到所有修正案例,例如纳西族中有个thrumb参数,我想应该是thumb,因此我不建议把无法判断的移除,建议留给人类判断;另外我在想机器人修改之后会不会让版面改变(虽然可能不是个大问题),如果不希望动到版面,反而是不做判断一律移除LintErrors列出的所有选项。--A2093064#Talk 2017年10月20日 (五) 13:37 (UTC)[回复]
其实"LintErrors"的意思就是说系统不能够解析判别,就算指定了也当作是错误选项,有跟没有展现的效果相同,因此删掉也不会造成版面改变。但是像数字的部分,因为可以猜测得出来原先编辑者的意思,因此这边就可以帮忙修正。因为过去曾经有类似作业的经验,这边不会一下子就马上把所有的东西都改变或者删掉,而是会一个一个尝试,程式码会不断测试修改,确认可行再继续作业下去。 --Kanashimi留言2017年10月20日 (五) 13:43 (UTC)[回复]
  批准测试运作(3项各20次编辑):“删除重复的档案选项”、“只有数值的选项加上"px"”、“删除空的档案选项”各批准测试20次,其馀的请先不要改。建议编辑摘要能够分别,好方便复查。其他的修复方式请再个别列出来。--A2093064#Talk 2017年10月27日 (五) 11:36 (UTC)[回复]
@A2093064  测试已完成 Special:LintErrors/bogus-image-options把所有种类的错误都列在一起了,因此比较不好甄别。请在编辑记录找寻关键字"bot test",谢谢。 --Kanashimi留言2017年10月29日 (日) 11:34 (UTC)[回复]
Special:Diff/46760966,缩略图是无效选项吗?而且此编辑反而产生重复选项了。
Special:Diff/46760841Special:Diff/46760471,删除重复的档案选项有误。
Special:Diff/46760553,最后面那个也是空的吧。
Special:Diff/46760308,解释一下。
Special:Diff/46760841,有框也是有效选项吧?
您也编辑太多笔了吧  囧rz……--A2093064#Talk 2017年10月29日 (日) 12:39 (UTC)[回复]
@A2093064感谢您的核验。多测试一点比较能看出问题所在。上面列的这些已经都修正了,再麻烦您看看了。 --Kanashimi留言2017年10月29日 (日) 16:19 (UTC)[回复]
我只有看到您撤销编辑,应该再让机器人把这几个页面跑一次?--A2093064#Talk 2017年11月3日 (五) 11:48 (UTC)[回复]
@A2093064这个任务需要倚赖LintErrors API,因此已经编辑过的页面就没有办法简单的指定页面后再重新编辑。这边另外做了一些编辑给您参考,请在编辑记录中找寻关键字"修正维基语法:",谢谢。 --Kanashimi留言2017年11月3日 (五) 12:44 (UTC)[回复]
已检查,都没有错误。下面列出的看看我有没有漏掉什么,我是根据Code列出的。--A2093064Xiplus 2017年11月5日 (日) 11:44 (UTC)[回复]
另外一些疑问,有些看起来是重复的caption,是否其中一个做为alt会比较好,对于 未规范且无效的档案选项 和 与档名重复且无作用的档案选项()。--A2093064Xiplus 2017年11月5日 (日) 11:44 (UTC)[回复]
@A2093064非常感谢您用心的检查。关于您提到"是否其中一个做为alt会比较好","未规范且无效的档案选项"这一项所列出的为长度极短、非有意义文字,抑或绝不可被拿来当作caption描述者。至于"与档名重复且无作用的档案选项",或许可列为caption,但也有很大机会误判(例如有"|.jpg|"这类的)。既然与档名重复,则删除此无效选项亦不会减损资讯量。至于此task,未知您认为是否已可,或者尚须测试。 --Kanashimi留言2017年11月5日 (日) 13:04 (UTC)[回复]
好吧,caption这就算了,反正原本也不会显示。至于下方黄色勾勾的我只是觉得测试较少,想再多看几个,反正您测试每个修正规则都会跑到吧?那就请再继续跑一些测试啰。--A2093064Xiplus 2017年11月8日 (三) 05:11 (UTC)[回复]
@A2093064  测试已完成 又做了一些测试。有些项目是逻辑上应该存在的,但是看起来实际上出现这种问题的并不多。 --Kanashimi留言2017年11月8日 (三) 07:13 (UTC)[回复]
您也可以参考在日文维基的编辑。 --Kanashimi留言2017年11月9日 (四) 08:36 (UTC)[回复]
已检查,我只看需要再检查的部分,这笔替换没跟需要指定值的移除配合到。下方绿色勾的就  正式批准运作。不过我想有办法单独执行已批准部分吗?要不然就还是一样继续测试啰。--A2093064Xiplus 2017年11月9日 (四) 11:37 (UTC)[回复]
非常感谢您帮忙检查。这一笔替换已经修正了,其他的就再测试一下好了,正在执行。 --Kanashimi留言2017年11月9日 (四) 11:51 (UTC)[回复]
已经把所有能判别的都完整跑完了,其他留下来的都是无法判别的。 --Kanashimi留言2017年11月9日 (四) 22:34 (UTC)[回复]
Special:diff/46940317,本地也可以用“左”吧?其馀的没有问题。正式批准“删除同类别之其他语系的档案选项”。--A2093064Xiplus 2017年11月13日 (一) 07:51 (UTC)[回复]
@A2093064谢谢您的检查,已更新。"删除同类别之别名"可以参考在日文维基的编辑。另外当前6,874个错误中发生于User:,User Talk:等File, Template, Category外的有4000+,不知是否亦可作业。 --Kanashimi留言2017年11月13日 (一) 09:29 (UTC)[回复]
不修正应该不会有什么问题吧?另,正式批准“将其他语系的档案选项改为本wiki相对应的档案选项”“删除同类别之别名”--XiplusA2093064 2017年11月19日 (日) 01:41 (UTC)[回复]
@Xiplus现在仅将作业限制于 main, File, Template, Category。 --Kanashimi留言2017年12月2日 (六) 12:35 (UTC)[回复]
@Kanashimi根据Tech News: 2017-49,看起来修正错误是必须的?--XiplusA2093064 2017年12月12日 (二) 16:25 (UTC)[回复]
那这边就申请对所有可判别的页面,包过讨论页以及使用者页也做变更? --Kanashimi留言2017年12月12日 (二) 22:44 (UTC)[回复]
@Kanashimi  正式批准运作于所有名字空间。--Xiplus#Talk 2017年12月30日 (六) 10:37 (UTC)[回复]
  1. “删除与档名重复且无作用的档案选项”,这样做未必合理。文件名包含文件选项的内容,可能有其他原因,比如“[[File:徐家汇观象台的历史照片.jpg|徐家汇观象台|建于1872年]]”
  2. “修正尺寸选项为px单位”也可能导致问题,比如“[[File:一款Nexus手机.jpg|5x|外观]]”

--Antigng留言2017年12月15日 (五) 13:02 (UTC)[回复]

的确是这样。上面列举出的例子,可能得要读得懂文章,然后才能够做出正确的判别。不过现在的问题是假如人工来处理的话,可能得要花极长的时间才能够大幅降低错误数量…… --Kanashimi留言2017年12月15日 (五) 13:34 (UTC)[回复]
一共几千个,可以先收紧范围,比如把\d{1,3} -> \d{2,3},跑完看剩下多少。--Antigng留言2017年12月15日 (五) 13:37 (UTC)[回复]
感谢提醒。"\d{1,3}"这个部份之前有发现,已经修改了。若还有发现问题请再提出。 --Kanashimi留言2017年12月15日 (五) 15:02 (UTC)[回复]
@Antigng“删除与档名重复且无作用的档案选项”仍然是机器人直接删除吗?不给人工判断了?--Xiplus#Talk 2017年12月24日 (日) 13:26 (UTC)[回复]

简要修正规则

  • 删除空档案选项,Code 已检查
  • 删除未规范且无效的档案选项,Code 已检查
  • 删除需要指定值但未指定值的档案选项,Code 已检查
  • 删除与档名重复且无作用的档案选项,Code 已检查
  • 修正尺寸选项为px单位,Code 已检查
  • 将尺寸选项改为正规形式,Code 已检查
  • 删除同类别之其他语系的档案选项,Code 已检查
  • 将其他语系的档案选项改为本wiki相对应的档案选项,Code 已检查
  • 删除同类别之别名,Code 已检查
  • 修正误植,Code 已检查
  • 修正错误的图片替代文字用法,Code 已检查
  • 删除重复的档案选项,Code 已检查
  • 去掉相同类别的无效档案选项,Code 已检查
  • 更新时间:2017年12月30日 (六) 10:37 (UTC)
 谢谢您 --Kanashimi留言2017年12月30日 (六) 10:47 (UTC)[回复]