python如何实现驻留字符串?

707次阅读
没有评论

python如何实现驻留字符串?

python驻留字符串的原因

字符串驻留提高了字符串比较的速度。若未驻留,则当我们要比较两个字符串是否相等时,其时间复杂度会升至O(n),也就是说,需要检查两个字符串中的每一个字符,以确定它们是否相等。

python驻留字符串的原理

如果字符串是固定的,那么因为相同的字符串将使用相同的对象引用,所以只要检查指针是否相同,就可以确定两个字符串是否相等,而不必再逐个检查每个字符。因为这是一种非常常见的操作,所以通常会将它作为指针相等检查来实现,只使用一条完全没有内存引用的机器指令。

String驻留可以减少内存占用。Python避免了内存中充满过多的字符串对象,并通过共享和重用已定义对象来优化内存占用。

实现驻留字符串:使用PyUnicode_InternInPlace函数

定义在 unicodeobject.c 中,当调用时,它会创建一个准备容纳所有驻留的字符串的字典interned,然后登记入参中的对象,令其键和值都使用相同的对象引用。

  void
  PyUnicode_InternInPlace(PyObject **p)
  {
      PyObject *s = *p;
 
      .........
 
      // Lazily build the dictionary to hold interned Strings
      if (interned == NULL) {
          interned = PyDict_New();
          if (interned == NULL) {
              PyErr_Clear();
              return;
          }
      }
 
      PyObject *t;
 
      // Make an entry to the interned dictionary for the
      // given object
      t = PyDict_SetDefault(interned, s, s);
 
      .........
 
      // The two references in interned dict (key and value) are
      // not counted by refcnt.
      // unicode_dealloc() and _PyUnicode_ClearInterned() take
      // care of this.
      Py_SET_REFCNT(s, Py_REFCNT(s) - 2);
 
      // Set the state of the string to be INTERNED
      _PyUnicode_STATE(s).interned = SSTATE_INTERNED_MORTAL;
  }
神龙|纯净稳定代理IP免费测试>>>>>>>>天启|企业级代理IP免费测试>>>>>>>>IPIPGO|全球住宅代理IP免费测试

相关文章:

版权声明:wuyou2021-05-06发表,共计1222字。
新手QQ群:570568346,欢迎进群讨论 Python51学习