<?xml version="1.0" encoding="UTF-8" ?>
<rss version="2.0">
<channel>
<title><![CDATA[向东博客 专注WEB应用 构架之美 --- 构架之美，在于尽态极妍 | 应用之美，在于药到病除]]></title> 
<link>https://jackxiang.com/index.php</link> 
<description><![CDATA[赢在IT，Playin' with IT,Focus on Killer Application,Marketing Meets Technology.]]></description> 
<language>zh-cn</language> 
<copyright><![CDATA[向东博客 专注WEB应用 构架之美 --- 构架之美，在于尽态极妍 | 应用之美，在于药到病除]]></copyright>
<item>
<link>https://jackxiang.com/post//</link>
<title><![CDATA[[实践OK]Linux文件比较操作comm命令实现文本文件的交集、差集与求差，一般求差集的多一些。]]></title> 
<author>jack &lt;xdy108@126.com&gt;</author>
<category><![CDATA[Php/Js/Shell/Go]]></category>
<pubDate>Fri, 23 Jun 2017 07:34:05 +0000</pubDate> 
<guid>https://jackxiang.com/post//</guid> 
<description>
<![CDATA[ 
	基本上有两个方法，一个是comm命令，一个是grep命令。分别介绍如下：<br/>comm命令 ， Compare sorted files FILE1 and FILE2 line by line. With&nbsp;&nbsp;no options, produce three-column output.&nbsp;&nbsp;Column one contains lines unique to FILE1, column two contains lines unique to FILE2, and column three contains lines common to both files. 要注意两个文件必须是排序和唯一(sorted and unique)的，默认输出为三列，第一列为是A-B，第二列B-A，第三列为A交B。这个哥们写得好，尽管我不懂linux文件流的用法，但是大致看出来了，我用了三个步骤，而用一行就搞定了，简单可用：http://m.blog.csdn.net/article/details?id=6579320<br/><textarea name="code" class="php" rows="15" cols="100">
求交集的办法： comm&nbsp;&nbsp;&lt;(sort a.txt&#124;uniq ) &lt;(sort b.txt&#124;uniq ) -12 #注意： &lt;( 这个中间没有穿格。左边文件有的在右边文件也有的。
求差集的办法：comm&nbsp;&nbsp;&lt;(sort all &#124;uniq ) &lt;(sort yw_all &#124;uniq ) -23&nbsp;&nbsp;#左边文件比右边文件多，求出右边文件缺少的。
</textarea><br/><br/>文件行数少最直观快捷的diff办法：<br/>vimdiff &lt;(sort a.txt&#124;uniq) &lt;(sort b.txt&#124;uniq)<br/><br/>/proc/15750/fd/63 [只读]&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;/proc/15750/fd/62 [只读] <br/>——————————————————————————————<br/>一般求差集的多一些：<br/>求差<br/>comm a.txt b.txt&nbsp;&nbsp;-3 &#124; sed &#039;s/^&#92;t//&#039;<br/>差集<br/>comm a.txt b.txt&nbsp;&nbsp;-2 -3<br/><br/>实践如下：<br/><br/>sort getosok.txt &gt;&gt; getosoksort.txt<br/>sort r11.txt &gt;&gt; r11sort.txt<br/>comm r11sort.txt getosoksort.txt&nbsp;&nbsp; -2 -3<br/><br/><br/><br/>再次实践，注意这两个文件都要去重,否则不太好比较，-2 -3显示左边文件有的右边没有的：<br/>sort mysqlsort.txt&#124;uniq&nbsp;&nbsp; //sort结合uniq命令去重复行找出重复次数大于1的行参考：http://justwinit.cn/post/3671/<br/><br/>sort 主机层面能ssh连接的.txt &#124;uniq &gt;&gt; 主机层面能ssh连接的排序过的去过重的.txt<br/>sort 数据库应用开发现在的.txt &#124;uniq &gt;&gt; 数据库 应用开发现在的排序过的去过重的.txt<br/><br/><br/><br/>comm&nbsp;&nbsp;数据库应用开发现在的排序过的去过重的.txt 主机层能ssh连接的排序过的去过重的.txt&nbsp;&nbsp; -2 -3<br/>10.71.11.4*&nbsp;&nbsp;//这个是列出左边有，右边文件没有的内容，也就是 “数据库应用开发现在的排序过的且去重的.txt”里有，而右边这个“主机层面能ssh连接的排序过的.txt” 没有。<br/><br/>comm 主机层面能ssh连接的排序过的去过重的.txt 数据库应用开发现在的排序过的 去过重的.txt -2 -3<br/>10.70.*.42<br/>10.70.*.53<br/>10.70.*.1<br/>10.70.*.2<br/>10.71.*.29<br/><br/>注意：<br/>1. comm命令要求输入文件的内容必须是排序且唯一的<br/>2. comm -12 表示取消第一列和第二列的输出，即只输出第三列。[/warning]<br/><br/>主机层面能ssh连接的排序过的有，而右边没有。<br/>http://www.ttlsa.com/linux/linux-file-comparison-operations-text-file-of-the-intersection-difference-sets-and-difference/
]]>
</description>
</item><item>
<link>https://jackxiang.com/post//#blogcomment</link>
<title><![CDATA[[评论] [实践OK]Linux文件比较操作comm命令实现文本文件的交集、差集与求差，一般求差集的多一些。]]></title> 
<author> &lt;user@domain.com&gt;</author>
<category><![CDATA[评论]]></category>
<pubDate>Thu, 01 Jan 1970 00:00:00 +0000</pubDate> 
<guid>https://jackxiang.com/post//#blogcomment</guid> 
<description>
<![CDATA[ 
	
]]>
</description>
</item>
</channel>
</rss>