python驻留字符串的原因
字符串驻留提高了字符串比较的速度。若未驻留,则当我们要比较两个字符串是否相等时,其时间复杂度会升至O(n),也就是说,需要检查两个字符串中的每一个字符,以确定它们是否相等。
python驻留字符串的原理
如果字符串是固定的,那么因为相同的字符串将使用相同的对象引用,所以只要检查指针是否相同,就可以确定两个字符串是否相等,而不必再逐个检查每个字符。因为这是一种非常常见的操作,所以通常会将它作为指针相等检查来实现,只使用一条完全没有内存引用的机器指令。
String驻留可以减少内存占用。Python避免了内存中充满过多的字符串对象,并通过共享和重用已定义对象来优化内存占用。
实现驻留字符串:使用PyUnicode_InternInPlace函数
定义在 unicodeobject.c 中,当调用时,它会创建一个准备容纳所有驻留的字符串的字典interned,然后登记入参中的对象,令其键和值都使用相同的对象引用。
void PyUnicode_InternInPlace(PyObject **p) { PyObject *s = *p; ......... // Lazily build the dictionary to hold interned Strings if (interned == NULL) { interned = PyDict_New(); if (interned == NULL) { PyErr_Clear(); return; } } PyObject *t; // Make an entry to the interned dictionary for the // given object t = PyDict_SetDefault(interned, s, s); ......... // The two references in interned dict (key and value) are // not counted by refcnt. // unicode_dealloc() and _PyUnicode_ClearInterned() take // care of this. Py_SET_REFCNT(s, Py_REFCNT(s) - 2); // Set the state of the string to be INTERNED _PyUnicode_STATE(s).interned = SSTATE_INTERNED_MORTAL; }
神龙|纯净稳定代理IP免费测试>>>>>>>>天启|企业级代理IP免费测试>>>>>>>>IPIPGO|全球住宅代理IP免费测试