Python反斜杠的示例分析
小编给大家分享一下Python反斜杠的示例分析,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!
首先我们写一段非常简单的Python代码,它的作用是把一个字段先转换为JSON格式的字符串,然后把这个字符串再转换为JSON格式的字符串:
importjson info={'name':'kingname','address':'杭州','salary':99999} info_json=json.dumps(info) #第一次转换以后,打印出来 print(info_json) info_json_json=json.dumps(info_json) #第二次转换以后,再打印出来 print(info_json_json)
它的运行效果如下图所示。
第一次,字典转成JSON格式的字符串,只有中文杭州变成了Unicode编码\u676d\u5dde
,其余地方没有出现反斜杠。
在Python里面,反斜杠不能单独出现,这里\u676d\u5dde
中的两根反斜杠,实际上应该是\u
。表示这两个编码是Unicode编码。
接下来,把第一次生成的JSON字符串:{"name": "kingname", "address": "\u676d\u5dde", "salary": 99999}
再一次转成JSON格式的字符串,这一次变成了:
"{\"name\":\"kingname\",\"address\":\"\\u676d\\u5dde\",\"salary\":99999}"
为什么突然出现了这么多反斜杠?这是因为,JSON格式的字符串本身是使用双引号来表示字符串的。如果原来的字符串里面本身就有双引号,那就会导致混淆。此时,Python需要把原来字符串的双引号变成普通的字符,失去双引号的作用。因此使用\"
让双引号变成普通的字符。
这就相当于在Python中,可以这样定义一个包含双引号的字符串:
>>>a="跟我说:\"你好\"" >>>print(a) 跟我说:"你好"
这里,你好两侧的双引号都加上了反斜杠,让它成为普通的字符,防止它们提前与最外层的双引号配对。
如果不加反斜杠,就会导致字符串里面的双引号提前与外层的双引号配对,引起语法错误:
>>>b="跟我说:"你好"" File"<stdin>",line1 b="跟我说:"你好"" ^ SyntaxError:invalidsyntax
这里,"跟我说:"
成为了一个字符串,末尾的""成为了一个空字符串。那么中间的你好就变成了一个没有定义的变量。而Python里面,是不存在字符串未定义的变量字符串
这种写法的,所以会报语法错误。
而JSON格式的字符串,本质上也是字符串,所以自然而然也需要遵循这样的规则。因此,字符串原来自带的双引号左侧就被加上了反斜杠。
那么,原来的\u676d\u5dde
为什么变成了\\u676d\\u5dde
?
这是因为,当第二次执行json.dumps
的时候,传入的参数是一个JSON格式的字符串,本质就是字符串。而一个字符串里面如果自带反斜杠,那么JSON在对他再次转换的时候,需要标记这是一个普通的字符串形式的反斜杠,不是一个有特殊意义的反斜杠,所以使用\\
表示一个普通的反斜杠。
好了,那么你可以猜一下,如果把info_json_json
再json.dumps
一下会怎么样?
会变成:
"\"{\\\"name\\\":\\\"kingname\\\",\\\"address\\\":\\\"\\\\u676d\\\\u5dde\\\",\\\"salary\\\":99999}\""
为什么出现了三个反斜杠连用和四个反斜杠连用的问题?
实际上非常简单,当你对info_json_json
执行json.dumps
的时候,Python是怎么转换的?
我们来看:
"{\"name\":\"kingname\",\"address\":\"\\u676d\\u5dde\",\"salary\":99999}"
对字符串
执行json.dumps
的时候,记住一个关键方法——从左到右,一个字符一个字符的转换。
1.第一个字符是双引号,所以变成\"2.第二个字符是{,不是特殊符号,保留3.第三个字符是\,把它变成\\4.第四个字符是",把它变成\"5.……
全部执行完成了,由于这次转换是把一个字符串转换为JSON格式的字符串,所以最外侧加上双引号。
于是就得到了:
"\"{\\\"name\\\":\\\"kingname\\\",\\\"address\\\":\\\"\\\\u676d\\\\u5dde\\\",\\\"salary\\\":99999}\""
我们在爬虫开发过程中,可能会遇到上面这种经过多次JSON转换后的字符串,此时,千万不要轻易使用字符串的.replace
方法把多个反斜杠替换为空或者把两个反斜杠替换为一个反斜杠。那样做只会导致你的数据更难解析。
正确的做法应该是尝试对数据一层一层使用json.loads
,把它一层一层还原,还原到最初的{'name': 'kingname', 'address': '杭州', 'salary': 99999}
这种简单形式。
好了,今天的介绍就到这里,最后留一个思考题:
还是上面的代码,现在把PyCharm的调试模式打开,然后数一数info_json
和info_json_json
里面反斜杠的个数,如下图所示:
为什么在info_json
里面,出现了\\u676d\\u5dde
,为什么在info_json_json
里面双引号前是两根反斜杠,而\"\\u676d\\u5dde\"
竟然变成了\\"\\\\u676d\\\\u5dde
。
以上是“Python反斜杠的示例分析”这篇文章的所有内容,感谢各位的阅读!相信大家都有了一定的了解,希望分享的内容对大家有所帮助,如果还想学习更多知识,欢迎关注恰卡编程网行业资讯频道!
推荐阅读
-
Python中怎么动态声明变量赋值
这篇文章将为大家详细讲解有关Python中怎么动态声明变量赋值,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文...
-
python中变量的存储原理是什么
-
Python中怎么引用传递变量赋值
这篇文章将为大家详细讲解有关Python中怎么引用传递变量赋值,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文...
-
python中怎么获取程序执行文件路径
python中怎么获取程序执行文件路径,很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的...
-
Python中如何获取文件系统的使用率
Python中如何获取文件系统的使用率,针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴...
-
Python中怎么获取文件的创建和修改时间
这篇文章将为大家详细讲解有关Python中怎么获取文件的创建和修改时间,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读...
-
python中怎么获取依赖包
今天就跟大家聊聊有关python中怎么获取依赖包,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据...
-
python怎么实现批量文件加密功能
-
python中怎么实现threading线程同步
小编给大家分享一下python中怎么实现threading线程同步,希望大家阅读完这篇文章之后都有所收获,下面让我们一起去探讨吧!...
-
python下thread模块创建线程的方法
本篇内容介绍了“python下thread模块创建线程的方法”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来...