元数据如何揭示您的想法比您想象的更多

  • 时间:
  • 浏览:25
  • 来源:it300
元数据如何揭示您的想法比您想象的更多

通过相关性和背景,元数据可以揭示多于几个被引导相信...

我正在吃Chipotle汉堡,配上新鲜的鳄梨酱,并在上周末与朋友交谈。他发现自己有点恼火,国家安全局正在监视人们,但表达了一种情绪,因为国家安全局只关注元数据并且他们没有阅读电子邮件或收听电话,因此情况并非如此糟糕。我几乎得到的印象是,美国国家安全局声称他们只关注元数据使其“更好”。

什么是元数据?

我最好的答案是元数据是关于数据的数据,而不是这样的定义确实有帮助,除非你考虑它。元数据为其他数据添加上下文。当我想到元数据时,我首先想到的是一件事是摄影。你显然有一张你可以看的照片,看看图像,颜色,阴影和构图。但是这张照片包含了你不一定能看到的背景,比如数字图片的大小,创作时间,图像分辨率是多少,包括本质上甚至不是摄影的数据,如作者,数据和时间,或者地理位置信息。有时,照片的含义会根据附加信息而改变。

考虑一下白毛动物的一部分照片(左图)。现在命名那个动物。潜在候选人名单很长,您根本无法确定具有任何置信水平的动物。但即便是关于这张照片的一些数据也可以极大地提高你的成功率CCESS。如果我告诉你这张照片是在科罗拉多拍摄的,你可以将你的选择限制在“山羊”或“狼”中。如果你知道这张照片是在哈德逊湾附近拍摄的,你很可能很容易将这种动物识别为北极熊。但如果我不告诉你这张照片是在秘鲁拍的,你会猜到“羊驼吗?”

如果你愿意的话,考虑一下右边的照片。我希望很少有人会马上认出来,虽然当我问几个人时,我得到的答案就像海滩的黑白照片,卫星地形,一块页岩,以及许多其他答案,试图找出看起来像什么条纹或层。我可以给你一个f-stop和焦距,但除非你有更多的背景,否则它可能没什么用。如果我告诉你这里没有诀窍,但只有用一个反射的白色卤素光源拍摄的微距摄影,我周一早上在地下室办公室拍了那张照片,这有帮助吗?可能不多,因为你仍然相对缺乏关于图片的数据;缺乏元数据。

因此,我们可以看到元数据的价值,但是否有足够的价值来建立一个专门用于识别,收集,传播和分析这些数据的长期项目?

假设下面的地图显示了Joe Green在没有写音乐的日子里的旅行。红色标记是Joe连接的一些单元塔,以及其中一些连接的时间范围。与Joe的呼叫相关的位置信息显然是元数据。没人在听他的电话,只是观察乔的位置一天旅行。我们可以从这些元数据中得知什么?

首先,我们知道乔住在Sleepy Hollow Rd附近。在弗吉尼亚州安嫩代尔。从午夜到早上7:30的时间戳最有可能显示乔在家,在床上,睡着了,然后准备工作。我猜可能会在五角大楼附近的7:50停留一家咖啡店(通过检查星巴克的位置来验证)。 8点15分,乔到了工作岗位。我们可以推测,因为从8:15到大约5:17,他的位置或多或少稳定。但乔没有回家。他在5点43分再次停下来。哪里?鉴于停止的时间大约是一个小时,它可能是一个快速的晚餐,或杂货,或饮料,或健身房;任何数量的活动。所以,只要看一下他旅行的地方的元数据,我们就知道了现在很多关于乔;尽管有所有那些愚蠢的红绿灯和Bailey十字路口定义的混乱,他住在哪里,他在哪里喝咖啡,在哪里工作,他把哥伦比亚派克带到办公室。我们知道他在正常工作周内使用了多少汽油(往返工作18英里)等等。每周六上午8点,他出现在陆军海军乡村俱乐部(ANCC)进行一轮高尔夫球比赛。由于他在ANCC打球,我们可能想知道Joe是军队的现任或前任军官还是国家安全社区的高级政府雇员。而且,由于他似乎在上午8点准时开球,我们可以假设他对ANCC有一定的吸引力。他花了3个多小时打他的球然后离开俱乐部,所以他可能没有打满18洞。他似乎在驾驶到Lubber Run Park约五分钟。也许他只需要五分钟就可以遛狗,朱塞佩威尔第(他的狗还有什么名字?),但就这样吧。作为元数据,除了他在ANCC玩的事实,这一点都不是特别有趣。

现在让我们考虑乔的电话记录(删除一些无意义的数字)。他每天约8:30在他上班后和每天结束的时候每天打电话555-555-5555,这似乎是在他开车的时候。首先是父母,配偶,女朋友/男朋友或孩子。 111-111-1111可能是电话会议号码。不知道谁能在晚上9点17分开始与222-222-2222进行54分钟的通话,除了一个亲密的家庭成员,兄弟,姐妹或父母。我的赌注是444-444-4444属于周六早上与他打高尔夫球的朋友。因此,虽然我们可以开始在人际关系中进行书写,但总的来说,这并不是非常有趣的信息。

关于他的短信的元数据是如此无聊,我甚至不包括它。他很少发短信,而且他们大多数都是如上所述的“疑似家庭”号码。除了每周六他离开Lubber Run Park的时候,他发送一个文本到666-666-6666。这更有趣,因为除了每个星期六的11:48之外,他从未与该号码进行任何其他呼叫或文本通信。

因此,这是乔在元数据中的生活的一部分。只是一些随机信息可能会或可能不会显示任何感兴趣的内容。而且,在乔的情况下,它是相当不合适的emarkable。但元数据的力量并不在于数据本身,而在于数据以自动方式处理和关联的能力。如果FBI正在收听窃听,计算机只能这么做。最后,关于窃听中听到的内容的最佳情报来自执法官员实际上正在听录音带并识别有趣的事情。必须处理音频。但元数据是可以由计算机而不是由人处理的原始数据。计算机可以获取Joe的原始元数据,并将该数据与其他人的数据进行比较;使用我的数据,您的数据,我女儿的数据,我的邮递员和其他所有人的数据。包括国家安全局或联邦调查局(或任何正在观看的人)可能会发现的人的数据特别关注。

所以,是的,他们可以包括娜塔莎的数据,因为他们知道娜塔莎没有好处。可用的元数据显示与Natasha相同类型的关于Joe的信息。 “他们”知道娜塔莎住在乔治城附近的公寓里。他们知道她作为文化专员工作的途径。他们知道她每天去哪里吃午饭。他们知道她拨打的号码和她发短信的人。他们知道她在罗斯林的一家健身房锻炼身体。他们知道她每周六下午都会在Lubber Run Park走她的BichonFrisé,Boris(真的,她还会叫他什么?)。他们知道她在哪里买杂货。如果娜塔莎是一个“感兴趣的人”,可能知道她使用的是什么样的牙膏。并且,他们有关于娜塔莎的所有信息都输入了计算机系统正在处理来自其他人的元数据,总是在寻找相关性。寻找模式和相似之处...

等一下。午餐后,她周六在路伯斯跑步公园的鲍里斯。我们是否认识经常在Lubber Run Park的其他人?

因此,因为一些充满元数据的计算机系统识别出相关性,所以Joe Green突然变成了一个感兴趣的人,而不仅仅是一堆元数据。执法和情报机构评估潜在的威胁;谁是Joe Green以及他有什么机会?如果乔在水晶城漫画书店工作,并在ANCC与他的USAF Ret打高尔夫球。上校兄弟,那么这可能很快就会成为临时噪音。如果乔持有许可并且目前在分类中使用执法项目,执法部门可能会传唤额外的电话记录和信息,以试图建立更多的背景;这是巧合还是真正的相关性?在某些时候,如果他们认为他们有足够的信息,他们认为实际的电子邮件文本,短信文本或电话音频将是有价值的,他们将建立可能的原因并寻求授权。

因此,元数据中的值与数据本身无关。元数据中的值是计算机系统处理大量元数据的能力,寻找可能无法找到的相关性。但要做到这一点,你真的需要大量的元数据,因为你希望能够尽可能快地添加尽可能多的上下文。

也许你听说过一点NSA项目ct有助于最大限度地提高元数据的数量和质量......

就上面的第二张图片来说,它是从我的Wakizashi大约一英寸半的hamon,从shinogi开始到了尖锐的边缘。从shinogi到mune的刀片部分隐藏在图片的顶部。真正的hamon上的线条来自折叠的钢材,产生1024层。该细节是所有“数据”,而不是元数据。除非您实际收听电话,否则您无法获得该级别的信息。

猜你喜欢

希腊最高法院批准俄罗斯对比特币嫌疑人的请求

希腊最高法院批准俄罗斯对比特币嫌疑人的请求希腊最高法院上周五表示,一名据称使用比特币数字货币洗钱40亿美元的俄罗斯人应该被引渡到俄罗斯,一位法院消息人士说。AlexanderV

2019-02-01

塑造美国网络防御的创造性破坏和自满情绪

塑造美国网络防御的创造性破坏和自满情绪创造性的破坏,思维的范式转换取代现有的秩序,可能是一个难以捉摸的概念,但它作为人类行为驱动力的力量是不可否认的。在硅谷和其他美国的高层科技

2019-02-01

为什么我(非常)担心PRISM

为什么我(非常)担心PRISM美国国家安全局正在利用我们的数字生活,监控语音电话,电子邮件,社交媒体以及谁知道什么。美国国家安全局方面的人说,这是为了国家安全;它已经停止了恐怖

2019-02-01

先发优势:为什么新的恶意软件最初会打败反恐

先发优势:为什么新的恶意软件最初会打败反恐虽然反病毒解决方案可以有效对抗广泛使用的恶意软件,但是有一个很好的机会,新的恶意软件会躲过那些解决方案。最近有重大安全事件的报告激增,

2019-02-01

台湾银行抢劫与朝鲜黑客有关

台湾银行抢劫与朝鲜黑客有关最近针对台湾一家银行的网络抢劫事件已被安全研究人员联系到一个据信在朝鲜境外活动的臭名昭着的威胁组织。黑客利用SWIFT全球金融网络大致窃取来自台湾远东

2019-02-01