`
san_yun
  • 浏览: 2596306 次
  • 来自: 杭州
文章分类
社区版块
存档分类
最新评论

定sina微博的全部用户(1亿以上)和标签(uniq的标签30万左右)的关系,系统找出共有2个或以上标签的用户对

 
阅读更多

python search:  http://www.google.com/cse/home?cx=009376466705745340527%3Acpxfleh5jbc

 

给定sina微博的全部用户(1亿以上)和标签(uniq的标签30万左右)的关系,系统找出共有2个或以上标签的用户对,并给出这些标签是哪些。

input_file:userid,taglist

output_file: userid,userid,con-taglist (sizeof(con_taglist)>=2)

例如:
A,体育 新闻 清华 百年校庆
B,娱乐 八卦 清华 新闻
C,体育 娱乐 新闻
D,八卦 新闻 娱乐

则输出:

A,B 清华 新闻
A,C 体育 新闻
B,C 娱乐 新闻
B,D 娱乐 八卦 新闻
C,D 娱乐 新闻

要求时空复杂度最低。

 

http://www.cnblogs.com/heaad/archive/2011/01/02/1924195.html

分享到:
评论

相关推荐

    linux下uniq和sort命令用法详解.docx

    linux下uniq和sort命令用法详解.docx

    uniq命令 去除文件中的重复行

    uniq命令全称是“unique”,中文释义是“独特的,唯一的”。该命令的作用是用来去除文本文件中连续的重复行,中间不能夹杂其他文本行。去除了重复的,保留的都是唯一的,也就是独特的,唯一的了。 我们应当注意的是...

    windows下的uniq

    windows下的uniq,很好用的小东西,配合Gawk使用更佳。

    Uniq extension-crx插件

    语言:English 在Mac或Windows PC上扩展Uniq,因此您可以跨合作伙伴平台等快速拨打电话号码。 无论您身在何处,在任何...Uniq提供了传统的PBX系统功能,并受益于电话服务应用程序,并为用户带来了公司通信中的新概念。

    Shell中的sort和uniq命令

    Shell中的sort和uniq命令 sort :通常用来排序 uniq :通常对重复字符进行处理 sort -n sort -r sort -u 去重,u: unique(独一无二的) sort -o 指定输出文件 sort -t 指定分隔符 sort -k 指定列排序(配合-t使用) ...

    linux下uniq和sort命令用法.docx

    linux下uniq和sort命令用法.docx

    uniq:Uniq 内核源码树

    Uniq是一个 x86 架构的操作系统内核。 它不是基于Unix或Linux的,我们可以说它是一个类Unix操作系统内核,整个内核是从头开始编写的。 此外,内核将在很大程度上尝试支持POSIX标准。 ####内核信息#### . . 开发...

    rh-nodejs6-nodejs-lodash.uniq-4.5.0-2.el7.noarch.rpm

    官方离线安装包,测试可用。使用rpm -ivh [rpm完整包名] 进行安装

    JavaScript 数组的 uniq 方法

    JavaScript 数组的 uniq 方法

    array-uniq:创建一个没有重复的数组

    创建一个没有重复的数组 安装 $ npm install array-uniq 用法 import arrayUniq from 'array-uniq' ; arrayUniq ( [ 1 , 1 , 2 , 3 , 3 ] ) ; //=> [1, 2, 3] arrayUniq ( [ 'foo' , 'foo' , 'bar' , 'foo' ] ) ; //...

    linux.chm文档

    zip -r file1.zip file1 file2 dir1 将几个文件和目录同时压缩成一个zip格式的压缩包 unzip file1.zip 解压一个zip格式压缩包 返回顶部索引 ^ RPM 包 - (Fedora, Redhat及类似系统) rpm -ivh package.rpm ...

    `sort | 的一个版本uniq -c` 输出在解析每一行时实时更新

    uniqtoosort | uniq -c版本sort | uniq -csort | uniq -c输出在解析每一行时实时更新。用法将一些基于行的东西输送到uniqtoo ,就像你在sort | uniq -csort | uniq -c 。这是一个计算此存储库中文件扩展名的示例,...

    sed uniq语法

    常用的SED uniq的语法,比较实用的资源,对LINUX的自动化运维和快速故障排除很有帮助

    uniqify:uniq和uniq -c用于网络! http

    这是一个使用 , 和的示例Web应用程序。 它演示了如何使用lein-cljsbuild将ClojureScript构建到JavaScript中。 要处理此示例项目,您首先需要安装 。 运行应用 设置并启动服务器,如下所示: $ cd example-...

    js代码-uniq去重(二)

    js代码-uniq去重(二)

    Javascript 更新 JavaScript 数组的 uniq 方法

    Javascript 更新 JavaScript 数组的 uniq 方法

    uniqtoo:`sort |的版本uniq -c`,其输出在解析每一行时实时更新

    的一个版本sort | uniq -c sort | uniq -c与输出,在实时更新的各行被解析。 用法 基于线进入管的东西uniqtoo一样的,你会进入sort | uniq -c sort | uniq -c 。 这是一个示例,该示例计算此存储库中文件的扩展名...

    linux sort join cut paste split uniq

    详细介绍linux下用于处理文本文件分类、合并、分割操作的工具 如:sort、uniq、join、cut、paste、split

Global site tag (gtag.js) - Google Analytics