如何保护你的 Python 代码 (一)—— 现有加密方案
0 前言
去年11月在PyCon China 2018 杭州站分享了 Python 源码加密,讲述了如何通过修改 Python 解释器达到加解密 Python 代码的目的。然而因为笔者拖延症发
本文同步发表于Prodesire博客。 0 前言 去年11月在PyCon China 2018 杭州站分享了 Python 源码加密,讲述了如何通过修改 Python 解释器达到加解密 Python 代码的目的。然而因为笔者拖延症发作,一直没有及时整理成文字版,现在终于战胜了它,才有了本文。 本系列将首先介绍下现有源码加密方案的思路、方法、优点与不足,进而介绍如何通过定制 Python 解释器来达到更好地加解密源码的目的。 由于 Python 的动态特性和开源特点,导致 Python 代码很难做到很好的加密。社区中的一些声音认为这样的限制是事实,应该通过法律手段而不是加密源码达到商业保护的目的;而还有一些声音则是不论如何都希望能有一种手段来加密。于是乎,人们想出了各种或加密、或混淆的方案,借此来达到保护源码的目的。 常见的源码保护手段有如下几种: 下面来简单说说这些方案。 1 发行 .pyc 文件1.1 思路 大家都知道,Python 解释器在执行代码的过程中会首先生成 .pyc 文件,然后解释执行 .pyc 文件中的内容。当然了,Python 解释器也能够直接执行 .pyc 文件。而 .pyc 文件是二进制文件,无法直接看出源码内容。如果发行代码到客户环境时都是 .pyc 而非 .py 文件的话,那岂不是能达到保护 Python 代码的目的? 1.2 方法 把 .py 文件编译为 .pyc 文件,是件非常轻松地事情,可不需要把所有代码跑一遍,然后去捞生成的 .pyc 文件。 事实上,Python 标准库中提供了一个名为 compileall 的库,可以轻松地进行编译。 执行如下命令能够将遍历 目录下的所有 .py 文件,将之编译为 .pyc 文件: python -m compileall 然后删除 目录下所有 .py 文件就可以打包发布了:
1.3 优点1.4 不足 python-uncompyle6 就是这样一款反编译工具,效果出众。 执行如下命令,即可将 .pyc 文件反编译为 .py 文件:
2 代码混淆 如果代码被混淆到一定程度,连作者看着都费劲的话,是不是也能达到保护源码的目的呢? 2.1 思路 既然我们的目的是混淆,就是通过一系列的转换,让代码逐渐不让人那么容易明白,那就可以这样下手: - 移除注释和文档。没有这些说明,在一些关键逻辑上就没那么容易明白了。 - 改变缩进。完美的缩进看着才舒服,如果缩进忽长忽短,看着也一定闹心。 - 在tokens中间加入一定空格。这就和改变缩进的效果差不多。 - 重命名函数、类、变量。命名直接影响了可读性,乱七八糟的名字可是阅读理解的一大障碍。 - 在空白行插入无效代码。这就是障眼法,用无关代码来打乱阅读节奏。 2.2 方法方法一:使用 oxyry 进行混淆 pyob.oxyry.com/ 是一个在线混淆 Python 代码的网站,使用它可以方便地进行混淆。 假定我们有这样一段 Python 代码,涉及到了类、函数、参数等内容:
经过 Oxyry 的混淆,得到如下代码:
混淆后的代码主要在注释、参数名称和空格上做了些调整,稍微带来了点阅读上的障碍。 方法二:使用 pyobfuscate 库进行混淆 pyobfuscate 算是一个颇具年头的 Python 代码混淆库了,但却是“老当益壮”了。 对上述同样一段 Python 代码,经 pyobfuscate 混淆后效果如下:
相比于方法一,方法二的效果看起来更好些。除了类和函数进行了重命名、加入了一些空格unix 文件加密,最明显的是插入了若干段无关的代码,变得更加难读了。 2.3 优点2.4 不足3 使用 py2exe3.1 思路 py2exe 是一款将 Python 脚本转换为 Windows 平台上的可执行文件的工具。其原理是将源码编译为 .pyc 文件,加之必要的依赖文件,一起打包成一个可执行文件。 如果最终发行由 py2exe 打包出的二进制文件,那岂不是达到了保护源码的目的? 3.2 方法 使用 py2exe 进行打包的步骤较为简便。 1)编写入口文件。本示例中取名为 hello.py:
2)编写 setup.py:
3)生成可执行文件
生成的可执行文件位于 dist\hello.exe。 3.3 优点3.4 不足4 使用 Cython4.1 思路 虽说 Cython 的主要目的是带来性能的提升,但是基于它的原理:将 .py/.pyx 编译为 .c 文件,再将 .c 文件编译为 .so(Unix) 或 .pyd(Windows),其带来的另一个好处就是难以破解。 4.2 方法 使用 Cython 进行开发的步骤也不复杂。 1)编写文件 hello.pyx 或 hello.py:
2)编写 setup.py:
3)编译为 .c,再进一步编译为 .so 或 .pyd:
执行 python -c "from hello import hello;hello()" 即可直接引用生成的二进制文件中的 hello() 函数。 4.3 优点4.4 不足 下文我们将重点介绍一种新的保护源码的方法。 相关文章:如何保护你的 Python 代码 (二)—— 定制 Python 解释器 (编辑:威海站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |