登陆注册
78496200000495

第495章 幻数据压缩算法猜想1

=数据压缩算法=速记算法=

递增素数之间,可以使用加法,得出相对小的数,可以用乘法,得出相对大的数,可以用乘方号,得出很大很大的数。

当使用特定长度把一个大数据分割成N个小片段时,就可以进行统计,比如全体相加,然后除以总数得到全局平均数。

然后使用1KB的平均数,1MB的平均数,1GB的平均数作为比大小基准。

然后还有特定数(比如出现了一次以上的多次数)(比如只出现了一次的一次数)(比如出现的最大值)(比如出现的最小值)。

现在的问题就是,统计能够获得数据的被过滤掉了很多信息的被压缩后的数据,如何使用统计获得的数据,来逆推原始数据(包括各种统计的先后顺序)(当然,因为数据的缺失,导致必须使用试错方式来实现)。

在处理大数据时,如何减少解压缩时试错次数,就是大数据压缩专用算法的重难点。

[示例]

如果有一个二进制数1010010010011100110001000100010,统计出其二进制的1总共有12个,二进制的0总共有19个;转换为八进制为12223461042,统计出其八进制的0总共出现了1次,八进制的1出现了2次,八进制的2出现了4次,八进制的3出现了1次,八进制的4出现了2次,八进制的6出现了1次;转换为十进制为1380868642,统计出其十进制的0出现了1次,十进制的1出现了1次,十进制的2出现了1次,十进制的3出现了1次,十进制的4出现了1次,十进制的6出现了2次,十进制的8出现了3次(当然了,为了加速碰撞,一般都是使用素数进制的方式,而不是使用这种方式,作者用这种方式示例,只是为了方便使用微软自带的程序员计算器换算进制,从而进行统计),那么接下来,就需要通过进制碰撞的方式,来逆推根据统计得出的原始数据。

当然了,也可以使用MD4,MD5和其他的哈希值生成算法,用于快速生成哈希值,以及记录上大小,然后是二进制的0和1,然后是八进制,16进制(一般都采取2的正整数次方进制的方式,来加速快速压缩时的速度,换算更快)。

另外还有一种快速碰撞的方式,使用大于X的(Y+1次方),小于X的Y次方的方式。

第一次比大小范围:

示例:取X=16;Y=18;

16^19=75,557,863,725,914,323,419,136

16^18=4,722,366,482,869,645,213,696

第二次比大小范围:

示例:取X=15;Y=7;

15^8=2,562,890,625

15^7=170,859,375

当然了,因为作者并没有使用16^19-16^18,然后再把结果进行开15次方,然后再进行筛查,可能就会导致第二次和第一次的相关度不高。

一个二进制数据根据位数,可以表达多少数值?

1位二进制,有两种可能,1和0。

2位二进制,有四种可能,00,01,10,11。

16位二进制,有2的16次方种可能,然而一个数据本身使用这么多位是一种浪费。

也就是说,一个16位二进制所表达的数,是一个固定数,是大于或等于0,小于2的16次方+1。

就比如说,一个1ZB大小的数据,只要其本身是固定的,那么就注定大于或等于0,然后小于2的多少次方来着???+1。

表达固定的数,并不一定需要使用到很长的长度。

比如2的987654321次方,可以是一个很大的数,其换算成二进制,会占用多大的存储空间?然后是不是可以逆推为算术内容:2的987654321次方?

问题就是,并非所有的数,都是规律数,都可以使用A的B次方+C乘以D+E阶乘方式正好等于该数,也就导致往往只能采取使用比大小的方式,无限近似,大于某个最接近该数的小数,小于某个最接近该数的大数。

比如说,想要记录一个5,那么在只能使用素数的表达方式时,就可以记录为该数大于3,小于7。

使用大于和小于之后,就可以获得一个数据范围,该范围内可能包含有有数的可能性,接下来的方法,就是把这个可能性减少,比如说(3+7)/5=2,则表示这个数正好处于大于和小于的中间值,比如说(3+7)/4=2.5,则表示这个数正好大于大于和小于的中间值;以此类推;

设定一个数为未知数B,A大于B小于C。

那么就可以取近似值(A+B)/C=D

一般情况下,D都是带有小数的,那么把D的小数去掉,那么D的整数部分就可以作为第二轮的最小值,D+1就可以作为第二轮的最大值。

取(A+B)/C=区间值1(也就是C更靠近A,还是更靠近B)。

(A-B)/(B-C)=区间值2

(A+C)/B=区间值3

(B+C)/A=区间值4

还有一种固定数大于小于法,就是A+→B←+C}总长度为多少位,特定数大于某个可以用循环速记法记录的数,小于某个可以用循环速记法记录的数。

然后就是使用特定算法生成一个数,该数大于B,然后使用特定刷房生成一个数,该数小于B。

示例:3*7=21;4*5=20;3*7大于B小于4*5;那么就可以获得该数百分之八十的近似值,然后再使用不断精准的继续用比大小法接近的方式,获得。

比如3.1415926

第一次比大小:4大于圆周率大于3

第二次比大小:3.14小于圆周率小于3.15

第三次比大小:3.141592小于圆周率小于3.141593

比大小之后,就是使用一个算术,来生成更接近的比大小精准度。

比如第一次比大小,大和小之间相差2的16次方,第二次比大小,大和小之间相差2的14次方,第三次比大小,大和小之间相差2的12次方,以此类推,就能快速还原出原始数据。

同类推荐
  • 黎明微亮

    黎明微亮

    他带着人类最后的希望,将时空撕裂,重回末世前几天,前世的不干与后悔,今生再也不会发生前世失去的笑容,今生不会了!…………情字一问,天下无解?恨字一问,因情而生!愤字一问,为恨提之!悔字一问,且由情,恨,愤生之!惑以?情何来,天下情,人间情,何解?
  • 太空绝恋

    太空绝恋

    人类最伟大的一次尝试,最终以失败告终。无法联系地球指挥部,损坏的太空站,二十余位太空移民。将在这死寂的外太空如何活下去……
  • 快穿之我和宿主的那些年

    快穿之我和宿主的那些年

    灵鸢正在提前进行退休生活,枸杞,瓜子,小曲,老年人有的她都要有。惬意的时候突然被一阵力吸到了一个空间,传说中任务者的中转站。据说她是被作为一个紧急联系人召来的。灵鸢:神的紧急联系人,过来我保证捶死他。时空管理局:不听,不听***系统:宿主你会黑客,摸过98k就算了。你为什么还会画符,建国后都不许成精,为什么你会?啊,喂,等等,为什么你还会免打扰模式......系统:我的宿主再也不是我认识的那个宿主了灵鸢:呵,你爸爸还是你爸爸————系统专职任务,可逆袭可打脸可悲可甜&可随宿主心情发挥,毕竟宿主......ps:无cp
  • 太空战

    太空战

    为了和平,一群青少年驾驶着战机去外太空作战,这一去,太空战即将开始
  • 重生还是毁灭呀

    重生还是毁灭呀

    我身处乱世,你也跑不了!-------【亓殷】我很乐观了,是他们不肯放过我!-------【闫磊】你是来看我笑话的吗?那可太好了,我也喜欢看笑话呢!---------【肖桦】就因为他说我生来不详,所以我就活该被欺辱?那就别怪我反抗啊!-------【嚯亥】你凭什么打破我的梦境?因为它是假的吗?--------【妲珀】今天是我的生日,捉我生日快乐啊?--------【孟靖】…………
热门推荐
  • 升D先生和降E小姐

    升D先生和降E小姐

    凡尔纳的短篇小说《升D先生和降E小姐》1893年在《费加罗画报》圣诞专号上发表,收录于短篇小说集《昨天和明天》。如果升D先生发了疯,10年以后他就不能娶上降E小姐了——这是地地道道受到老天爷祝福的婚姻。这就证明,纵然有8分之一的音差,有两个同音异名音符之间的音差,正如埃法拉奈师傅所说的那样,他们结成夫妇,仍然能够得到幸福。
  • 我要成为你的女人

    我要成为你的女人

    他,前世是孔氏织坊接班人,今生是大学毕业自己创业的CEO,来生是冷面冰山的富二代。她:"哥哥你好帅,我要成为你的女人"他一听,三下两除脱掉衣物,与她春风一度。她:"雨泽哥哥,我要成为你的女人"他满脸黑线,她看到他吃瘪,连忙拍手叫好。她:"帅哥,我要成为你的女人"他爱理不理,调头就走…她紧追不舍。三生三世,他爱她,从未改变
  • 豪门宠婚:老婆不太乖

    豪门宠婚:老婆不太乖

    五年前,秦宁借子上位嫁给了澜城第一男神,在澜城众人看来,她除了一张脸能配得上盛司宸外,其他一无是处。对此,澜城的吃瓜群众都在坐等她被扫地出门。某一天周末,秦宁好奇的问盛司宸:“老公,网上说你要和我离婚。”盛司宸:“那是他们瞎说。”秦宁:“他们说你根本就不爱我,如果没有孩子肯定都不会娶我。”盛司宸:“怎么会,我爱不爱你昨晚没有感受到?”秦宁:“……”我有多爱你唯有时光知道
  • 如果没如果

    如果没如果

    有时候,最重要的人会在稍后才出现。【还原真实的高三】一啄一饮,尽是前缘顾小鸣曾经觉得自己遇见了最好的人,喜欢上了一个最好的人,却没发现她自己奋力推开、从未在意的那个才是最好的人。
  • 天行

    天行

    号称“北辰骑神”的天才玩家以自创的“牧马冲锋流”战术击败了国服第一弓手北冥雪,被誉为天纵战榜第一骑士的他,却受到小人排挤,最终离开了效力已久的银狐俱乐部。是沉沦,还是再次崛起?恰逢其时,月恒集团第四款游戏“天行”正式上线,虚拟世界再起风云!
  • 嫡女要上房

    嫡女要上房

    她是嫡女,可从小就依附在庶母的名下,连个庶女也比她强。所幸她已不是原来那个她,自然比起那些个妹妹弟弟要强,人活着就是为了争口气,她要出埋藏在肚子里的恶气加怨气!
  • 车间的午夜

    车间的午夜

    这是一段让人很不安的经历。发生过的这些事情曾让我一度彻夜难眠。一次新厂的派遣意外听到了一些厂里的传闻,而后发生了许多令人匪夷所思的事情,而在慢慢揭开真相的同时却发现了一件更为让人感到意外的事情,这一切竟然是为了....
  • 万物园探险家

    万物园探险家

    世界一分为二,一百年前,人们打通了前往万物园的道路,就此开启了大冒险时代
  • 多情王爷缠王妃

    多情王爷缠王妃

    时而精明,又时而迷糊的她,身边总是围绕着他们。哥哥?可以!兄弟?没问题!恋人?不行!相公?不可以!每每只要想与她更近一步,最后换来的都是她的远离。周围的人换了又换。咦?原来还有一人始终在她身边。永远对她露出那开心纯真的笑容。她可以与他永远这样无负担的相处下去吧?
  • 触摸生活

    触摸生活

    女子的成长,就像一条河的流淌……安静、清幽、流畅……时而溅起光晕,泛起波纹……