不断学习python的过程里,总能遇到各种形形色色的函数或者方法,本章给大家带来python union的用法,具体内容如下:
union()方法
描述:union() 取并集,效果等同于 | ,重复元素只会出现一次,但是括号里可以是 list,tuple,其他 , 甚至是 dict
语法:
set.union(set1, set2...)
参数:
set1 — 必需,合并的目标集合
set2 — 可选,其他要合并的集合,可以多个,多个使用逗号 , 隔开。
代码示例:
#两个集合的并集 set1 = {'小苹果','大桃子','长香蕉'} set2 = {'小李子','大萝卜','长香蕉'} set1.union(set2) {'大桃子', '大萝卜', '小李子', '小苹果', '长香蕉'}#长香蕉只出现一次 #三个集合并集 set3 = {'烂柿子','罗志祥'} set1.union(set2,set3) {'大桃子', '大萝卜', '小李子', '小苹果', '烂柿子', '罗志祥', '长香蕉'} #集合和列表也可以 set4=['小可爱','西红柿'] set1.union(set4) {'大桃子', '小可爱', '小苹果', '西红柿', '长香蕉'} #利用交集并集来写一个字符串相似的小方法 def jaccard_sim(arg0,arg1): set1 = set(arg0) set2 = set(arg1) sim = len(set1.intersection(set2))/len(set1.union(set2)) return(sim)#intersection 求集合的交集 arg0 = '(质量问题)标识标签不合格' arg1 = '(质量问题)涉嫌质量不合格' jaccard_sim(arg0,arg1) 0.6428571428571429 #检测下两个标题的相似性 arg0 = '罗志祥道歉人设崩塌:多个品牌商中枪 代言微博遭删除' arg1 = '凌晨五点的罗志祥:你知不知道为了出轨,我有多努力' jaccard_sim(arg0,arg1) 0.14285714285
好了,大家再编程时候,也可以应用看看哦~如需了解更多python实用知识。
神龙|纯净稳定代理IP免费测试>>>>>>>>天启|企业级代理IP免费测试>>>>>>>>IPIPGO|全球住宅代理IP免费测试