Tuesday, May 11, 2021

OSCHINA 社区最新专区文章

OSCHINA 社区最新专区文章


迅睿CMS 创建网站表单

Posted: 10 May 2021 07:20 PM PDT

全局网站表单插件:https://www.xunruicms.com/shop/app/710.html 网站表单性能和内容模块一样,支持百万级数据,附表按5万为基数自动分表。 网站表单可以做什么? 1、友情链接 2、用户留言 3、网站证书 4、在线订单(需配合交易系统) 5、在线报名 6、banner轮播图 如何创建网站表单? 第一步、创建表单 第二、给网站表...

HBase 的 rowkey 设计需要遵循什么原则,以及如何解决热点问题

Posted: 10 May 2021 06:43 PM PDT

主要为以下三个原则: 1、 长度原则 :最大64K,在保证业务需求的前提下,建议越短越好,不要超过16个字节 2、 散列原则 :将rowkey的高位作为散列字段,低位放时间字段,这样将提高数据均衡分布在每个RegionServer,以实现负载均衡的几率 3、 唯一原则 : 必须在设计上保证其唯一性 热点问题: 概念:热点发生在大量的 ...

HDFS 大量的小文件会造成什么影响,你是如何解决的?

Posted: 10 May 2021 06:40 PM PDT

hdfs大量小文件影响: 1.HDFS上每个文件都要在NameNode上建立一个索引,这个索引的大小约为150byte,这样当小文件比较多的时候,会大量占用NameNode的内存空间,使得namenode压力过大,且hdfs能存储的数据量也会变小,影响hdfs的横向扩展能力; 2.小文件过多会使索引文件大量增加,使得索引速度变慢。如果使用mapreduce...

数据倾斜产生原因有哪些,你有哪些好的思路来解决?

Posted: 10 May 2021 06:37 PM PDT

我们以 Spark 和 Hive 的使用场景为例。 他们在做数据运算的时候会涉及到,count distinct、group by、join on 等操作,这些都会触发 Shuffle 动作。一旦触发 Shuffle,所有相同 key 的值就会被拉到一个或几个 Reducer 节 点上,容易发生单点计算问题,导致数据倾斜。 一般来说,数据倾斜原因有以下几方面: 1)key 分布...

简述Spark的宽窄依赖的概念,以及Spark如何划分stage,每个stage又根据什么决定task个数 ?

Posted: 10 May 2021 06:30 PM PDT

窄依赖:父RDD的分区最多只会被子RDD的一个分区使用。 宽依赖:父RDD的一个分区会被子RDD的多个分区使用(宽依赖指子RDD的每个分区都要依赖于父RDD的所有分区,这是shuffle类操作)。 stage的划分:stage的划分是基于DAG确定的依赖关系,借此来划分stage,将依赖链断开,每个stage内部可以并行运行,整个作业按照stage顺...

如何解决Sqoop导入导出Null存储一致性问题

Posted: 10 May 2021 06:13 PM PDT

Hive 中的 Null 在底层是以"\N"来存储; 而 MySQL 中的 Null 在底层就是 Null; 为了保证数据两端的一致性; 在导出数据时采用--input-null-string 和--input-null-non-string 两个参数; 导入数据时采用--null-string 和--null-non-string。...

Shell 脚本中单引号和双引号的区别

Posted: 10 May 2021 06:10 PM PDT

关于Linux系统中Shell脚本的变量引用问题,总结了以下5点。 其中$sts_date为测试脚本中的$1,即第一个脚本输入参数。 echo '$sts_date' --$sts_date echo "$sts_date" --2021-05-11 echo "'$sts_date'" --'2021-05-11' echo '"$sts_date"' --"$sts_date" echo `date` --2021年 05月 11日 星期二 09:02:08 CST 总结如下:...

2021-05-10:阶乘结果尾数有多少个零?

Posted: 10 May 2021 08:42 AM PDT

2021-05-10:阶乘结果尾数有多少个零? 福大大 答案2021-05-10: 时间复杂度:O(logn)。在这种方法中,我们将 n 除以 5 的每个幂。根据定义,5 的 log5(n)幂小于或等于 n。由于乘法和除法在 32 位整数范围内,我们将这些计算视为O(1)。因此,我们正在执行 log5(n)* O(1)=logn 操作。 空间复杂度:O(1),只是用了常数空...

No comments:

Post a Comment