第六一六章 机器智能学习创造系统-《大明1805》


    第(3/3)页

    “我的建议是全部非默认,任何用于机器学习的资料,都必须得到创作者的直接授权。

    “这样做的目的不是为了阻止机器学习继续进化。

    “恰恰是要规范机器学习行业。

    “未来是大数据的时代,机器学习的规模必然会越来越大。

    “如果不限制机器学习的范围和规则,必然导致这个产业的混乱发展。

    “必然导致机器学习开发者互相抄袭且不可控。

    “抄袭数据原子当然不是抄袭,那抄袭数据库肯定就是抄袭了吧?

    “就像照搬一个字库的范围不算抄袭,但照搬一本大词典那就绝对是抄袭了。

    “在大数据和机器学习的新时代,数据资料应该是有新的权属规范。

    “任何数据和资料,都应该是有权属的,都是有价值的。

    “我认为这应该是下个时代的时代逻辑。

    “有了这样的基础规则,有了规范的收费和授权的基本规则。

    “相应的数据模型开发者,才有机会将通过有授权的数据,开发出同样有授权的数据模型。

    “进而可以不受额外限制的使用机器生产的产品去盈利。

    “否则,任何机器学习最终产生的作品,其著作权归属都是模糊和敏感的。

    “机器不是人类,所以人类可以不保护机器的著作权,完全不认可机器创作的作品的著作权。

    “只有将机器视为人类的机器,创作的作品的著作权属于其主人所有。

    “才能以人类著作权的逻辑获得保护并盈利。

    “但人类想要利用别人的素材盈利,就必须获得对方的授权了,这样也就形成了清晰的著作权归属。

    “透过现象看本质的话,用机械智能完成以前只有人能够完成的工作,并且讲产量和速度提升几十几百倍,是又一次的产业革命。

    “生产力会再次跨越式的提升,技术能够覆盖的产品的生产成本会大幅度下降,由此产生的效益大幅度提升。

    “为智能机器成功运行起来提供原料的人,有分享这种生产力提升所带来的利益的权利。

    “不能将个人欣赏学习的授权许可,用于研发和制造任何生产工具。

    “这样数据资料有价论的逻辑也就清晰了。”

    朱靖垣听完之后看向朱迪钚:

    “老二你怎么看?”

    朱迪钚沉默思考了几秒钟,最终慢慢的点着头说:

    “我觉得迪镧的话有道理……

    “用微积分的逻辑来评判和区分学习、模仿、抄袭的界限是个很不错的理念。

    “未来的公共网络平台上,创作者上传自己的作品的时候。

    “应该有一个是否允许机器学习的选项。

    “同时也应该有一个是否使用大数据筛选和推荐信息的选项。”

    朱迪镧听了马上附和说:

    “我赞成二哥的意见。”

    朱靖垣笑着说:

    “既然你们哥俩都觉得可行,那这些事情就这么定了吧。

    “不过问题是,你们怎么判断一个数据模型,是否用了未经授权的材料来训练呢?

    “在数据分析层面你们有办法区分吗?”

    朱迪钚想了想说:

    “可以在未经授权的素材中添加一些验证数据,规避未经许可的机器学习的使用甚至污染数据模型。

    “不过……单纯依靠技术手段是不行的,无法完全规避违规者的破解和甄别以及反破坏技术。

    “所以还是要用社会和制度层面的限制以及事后处置方法……”

    朱迪钚说到这里看向了弟弟。

    朱迪镧想了想说:

    “制度上有两个方向,一个是默认全部授权,同时默认全部收费。

    “目前互联网上的大规模艺术作品平台,都是朝廷和四大产业集团的官方平台。

    “民间厂商和用户想要自行建立数据模型,只能从这些平台上采集数据。

    “所以可以规定,没有向现有平台之一付费取得授权资格的厂商,都直接按照违规处罚。

    “另一个方向,是就由四大产业集团出面,各自设计一套基础软件框架。

    “相当于一个带有强制过滤和筛选功能的装置。

    “民间厂商做任何的数据训练,必须在这个基础软件框架之上开发。

    “也就是放在这个过滤装置之内。

    “这个过滤程序自动甄别未经授权的材料标记,直接不将未经授权的材料投入训练过程。

    “同时互联网上应该在授权和未授权的材料上加入专门标记。

    “供过这些滤装置直接识别。

    “这些方案可以与二哥的技术方案同步实行。”

    朱迪钚听了不由得点头:

    “好,识别和反训练技术是必须开发的。”

    朱靖垣也没有评价两人的设想,就让朱迪钚和朱迪镧哥俩商量着办了。


    第(3/3)页