Hallelujah - C++博客

有效利用标准库提供的type_traits，让程序在编译时作出分支选择

让程序中的简单if-else在编译期间决定

ex. 1 /*

2  * =====================================================================================
3  *
4  *       Filename:  3.cpp
5  *
6  *    Description:
7  *
8  *        Version:  1.0
9  *        Created:  03/01/2016 11:38:53 AM
10  *       Revision:  none
11  *       Compiler:  gcc
12  *
13  *         Author:  shih (Hallelujah), sh19871122@gmail.com
14  *   Organization:
15  *
16  * =====================================================================================
17  */
18
19 #include <stdio.h>
20 #include <stdint.h>
21 #include <iostream>
22 #include <type_traits>
23
24 template<typename T>
25 struct is_swapable
26 {
27     static const bool value = std::is_integral<T>::value && sizeof(T) >= 2;
28 };
29
30 template<typename T>
31 T byte_swap(T value, std::true_type)
32 {
33    uint8_t *bytes = reinterpret_cast<uint8_t *>(&value);
34    for (std::size_t i = 0; i < sizeof(T)/2; ++i)
35    {
36        uint8_t v = bytes[i];
37        bytes[i] = bytes[sizeof(T) - 1 - i];
38        bytes[sizeof(T) -1 -i] = v;
39    }
40    return value;
41 }
42
43 template<typename T>
44 T byte_swap(T value, std::false_type)
45 {
46     return value;
47 }
48
49 template<typename T>
50 T byte_swap(T value)
51 {
52     return byte_swap(value, std::integral_constant<bool, is_swapable<T>::value>());
53 }
54
55 int main(int argc, const char *argv[])
56 {
57     int a = 0x11223344;
58     long b = 0x4455221112345678;
59     std::cout << std::hex << a << " " << b << std::endl;
60     std::cout << std::hex << byte_swap(a) << " " << byte_swap(b) << std::endl;
61     uint8_t c = 0x11;
62     char *d = "hello world";
63     std::cout << std::hex << byte_swap(c) << " " << byte_swap(d) << std::endl;
64     return 0;
65 }
66

posted @ 2016-04-28 17:50 Hallelujah 阅读(1328) | 评论 (0) | 编辑收藏

CentOS 7安装EPEL Repo

安装额外的EPEL仓库

wget https://dl.fedoraproject.org/pub/epel/7/x86_64/e/epel-release-7-2.noarch.rpm

yum install epel-release-7-2.noarch.rpm

安装后就可以安装R等了

posted @ 2014-10-22 07:56 Hallelujah 阅读(2396) | 评论 (0) | 编辑收藏

使用Python通过Hive的Streaming来写UDF的一些记录

最近使用Hive来统计数据，用了pyhs2来实现查询，但是有些复杂的处理比如，自定义对域名的处理等，不能通过hql来实现，发现能够使用udf。

Java来实现Hive的写法

package jsl.hive.udf;

import org.apache.hadoop.hive.ql.exec.UDF;
import org.apache.hadoop.io.Text;

public final class DomainRoot extends UDF {
    public Text evaluate(Text s) {
        if (s == null) {return null;}
        String tmp = s.toString();
        tmp = this.getDomainRoot(tmp);
        return new Text(tmp);
    }

    private String getDomainRoot(String domain) {
        throw NoneImplementException("xxxx");
    }
}

如果Java的UDF需要当成常用的，不用每次add可以注册到Hive中，

ql/src/java/org/apache/hadoop/hive/ql/exec/FunctionRegistry.java中加入

registerUDF("domain_root", UDFParseUrl.class, false);并重新编译hive即可

下面来说说重点，通过Streaming用Python来写处理。
关于Streaming的基础内容：

约束：首先必须add file到hive中（当python中引用了其他如自己写的模块时，也需要一并add进去）
其次非常不幸,在单独的一个查询中，不能够使用UDAF的函数如sum()
再次不得为中间结果数据使用cluster by或distribute by

注意：对于优化查询，使用cluster by或distribute by 和sort by一起非常重要

posted @ 2014-09-12 11:41 Hallelujah 阅读(2103) | 评论 (0) | 编辑收藏

C++编译期契约之must_have_base

在C++中不直接支持约束，用过C#模板的有个where来处理，但是C++中也有些小的技巧来处理。
在不完美C++中的must_have_base如下：

template<typename D, typename B>
struct must_have_base
{
    ~must_have_base()
    {
        void (*p)(D*, B*) = constraints;
    }

private:
    static void constraints(D *pd, B *pb)
    {
        pb = pd;
    }
};
原理是通过不执行的成员函数把函数指针在析构函数中赋值，强迫编译器在编译期间检查成员函数内的约束。

自己写了个小的实例，虽然这儿有点点牵强，但是，很多情况也需要检查是否是某种类型的子类型的时候还是可以的，
完整代码如下：

1
2 template<typename D, typename B>
3 struct must_have_base
4 {
5     ~must_have_base()
6     {
7         void (*p)(D*, B*) = constraints;
8     }
9
10 private:
11     static void constraints(D *pd, B *pb)
12     {
13         pb = pd;
14     }
15 };
16
17 class base
18 {
19 public:
20     virtual ~base() {}
21
22     virtual void run() = 0;
23 };
24
25 class inherit_base: public base
26 {
27 public:
28     virtual void run()
29     {
30
31     }
32 };
33
34 class inherit_not_base
35 {
36 public:
37     virtual void run()
38     {
39
40     }
41 };
42
43 class test
44 {
45 public:
46     template<typename T>
47     void testfunc(T &t)
48     {
49         must_have_base<T, base>();
50
51         t.run();
52     }
53 };
54
55 int main()
56 {
57     test t_ok, t_nok;
58     inherit_base hb;
59     inherit_not_base hnb;
60     t_ok.testfunc(hb);
61     t_nok.testfunc(hnb);
62
63     return 0;
64 }

抛砖引玉，希望这些东西都能用在实际的工程代码中。

posted @ 2014-07-29 12:25 Hallelujah 阅读(1508) | 评论 (0) | 编辑收藏

Vagrant启动自己CentOS的时候出现文件夹不能正常挂载

解决办法：
$ vagrant plugin install vagrant-vbguest
$ vagrang reload

reload会重新编译vbox的additions，然后mount就能成功了
我的环境是CentOS 6.5，在yum中开启了kernel更新的，默认是exclude=kernel*

这是别人给的解决方案：

vagrant up; vagrant ssh -c 'sudo ln -s /opt/VBoxGuestAdditions-4.3.10/lib/VBoxGuestAdditions /usr/lib/VBoxGuestAdditions'; vagrant reload

posted @ 2014-06-05 11:16 Hallelujah 阅读(1820) | 评论 (0) | 编辑收藏

kivy的第一步------安装，与IDEA共同开发

环境：Windows 7 64bits，IDE:IntelliJ IDEA 13.1.2
安装kivy：1. 下载安装包http://kivy.org/#download，我使用的是Python 2.7.6，选择的2.7版本（注意此版本是32位Python）
2. 解压到一个目录，我在我的系统环境变量中将根目录命名为了KIVY_ROOT
3. 虽然kivy中自带了Python的，可以直接使用，也可以自己安装，我是自己下载的Python 2.7.6（记得一定是32位，不然后面写程序会出问题）
4. 如果机器以前没安装git的，可以直接使用KIVY中带的mingw，我自己机器安装了git，所以环境变量就没设置mingw的
5. 设置环境变量，GST_REGISTRY=%KIVY_ROOT%gstreamer\registry.bin
GST_PLUGIN_PATH=%KIVY_ROOT%gstreamer\lib\gstreamer-1.0
PATH变量中加入了%KIVY_ROOT%;%KIVY_ROOT%tools;%KIVY_ROOT%gstreamer\bin;（还有Python的mingw的）
最后，需要在PYTHONPATH中加入%KIVY_ROOT%kivy
最后写入第一个程序来测试：
代码如下

1
2 # -*- coding:utf-8 -*-
3 #/user/bin/env python
4
5 __author__ = 'shih'
6
7 from kivy.app import App
8
9 class Hello(App):
10 pass
11
12 if __name__ == "__main__":
13 Hello().run()

执行结果如下：

posted @ 2014-05-18 20:35 Hallelujah 阅读(1282) | 评论 (0) | 编辑收藏

Python特殊方法的操作符重载表

不知道里面怎么弄表格，就上传图片了

如果用户自定义的类，想有add功能，如果类没提供__add__或__radd__方法的话，会抛出异常
再如，if xxxobj:默认是如果xxxobj不是None则为True，否则为False，如果不是这个逻辑则可以通过实现__bool__方法(自己的测试中2.7需要再加上__nonzero__()方法，3.2中直接就行)

posted @ 2014-04-14 11:38 Hallelujah 阅读(322) | 评论 (1) | 编辑收藏

zeromq学习，第一章

Asynchronous Input/Output（AIO）：AIO可以在input/output的请求到来之前继续执行。AIO在实时应用程序中是必须的。使用AIO可以映射多个任务到一个线程上去。
首先zeromq的设计是弱中间人的（brokerless，相对于ActiveMQ、RabbitMQ等,使用0zq的程序就可以直接和其他的节点通信而不通过broker的代理。），zeromq不会存储信息到磁盘上，然而可能使用本地的交换文件来存储消息（当设置了zmq.SWAP时）。

示例：HelloWorld（server）

server

示例：Helloworld（client）

client

这里使用了最基本的请求应答架构。详细解析代码：
第一步：创建了context和socket，zmq_ctx_new方法创建了一个新的context，这是线程安全的，即一个context可用于多个线程操作。 zmq_socket方法创建了一个在context中定义的socket，ZeroMQ的socket不是线程安全。传统的socket是同步的，然而ZMQ的socket在客户端和服务端都维护了一个队列来管理request-reply的异步模式。ZMQ自动的处理连接、重连、断开连接和内容交付。
服务端创建了Reply（ZMQ_REP）用来处理接收消息并应答消息。如果客户端和服务端遗失（lost），应答的消息将在没有任何通知的情况下丢掉。
客户端创建了一个Request(ZMQ_REQ)来发送消息并接收来自服务的应答。ZMQ_REQ下不会丢弃任何信息，不管是没有没有可用与发送消息的服务或是服务处于忙状态，所有的发送操作zmq_send函数会阻塞，直到一个服务变为可用于发送消息。ZMQ_REQ和ZMQ_REP、ZMQ_ROUTER类型兼容。
消息的发送zmq_send函数的第三个参数是flags，是ZMQ_DONTWAIT或ZMQ_SNDMORE。ZMQ_DONTWAIT表明消息是异步的发送。ZMQ_SNDMORE表明消息有多部分，其余的部分已经“在路上了”。消息接收函数zmq_msg_recv函数，如服务端，在先前接收的消息是无效的。第三个参数flugs可能是ZMQ_DONTWAIT。

先睡觉了

posted @ 2014-03-16 23:41 Hallelujah 阅读(3677) | 评论 (2) | 编辑收藏

Python的参数解包小技巧（使用容器作为参数时）

1 def args_unpacking_test(x, y):
2 print 'x = ', x, ' y = ', y
3
4 A = namedtuple('A', 'y x')
5
6 list_foo = [3, 4]
7 tuple_foo = (3, 4)
8 ntuple_foo = A(4, 3)
9 dict_foo = {'y':4, 'x':3}
10
11
12 args_unpacking_test(*list_foo)
13 args_unpacking_test(*tuple_foo)
14 args_unpacking_test(*ntuple_foo)
15 args_unpacking_test(**dict_foo)
16
17 他们的结果输出都是一样的

这个方式处理非常有用，如果参数个数不一致的话会报错

posted @ 2013-12-31 11:07 Hallelujah 阅读(1158) | 评论 (0) | 编辑收藏

Oracle的编程准备工作：搭建本地的基本环境

首先下载Instant Client，我下载的11.2

下载的文件包括如下列表：
1. instantclient-basic-nt-11.2.0.3.0.zip
2. instantclient-odbc-nt-11.2.0.3.0.zip
3. instantclient-sdk-nt-11.2.0.3.0.zip
4. instantclient-sqlplus-nt-11.2.0.3.0.zip
5. instantclient-tools-nt-11.2.0.3.0.zip

最后两个随便了，解压文件到instantclient_11_2目录中

命令行下到解压的目录instantclient_11_2中执行>odbc_install

在环境变量中的系统变量PATH中加入instantclient_11_2目录的全路径

创建一个用户变量ORACLE_HOME，指向ic的安装目录，这点很关键，特别是用cmake编译soci，并需要支持Oracle的话。

在ic目录中创建network/admin目录，并加入OCI的.ora文件，在环境变量中加入TNS_ADMIN来指定刚才创建的目录

创建一个用户变量NLS_LANG来设置语言，我的设置是SIMPLIFIED CHINESE_CHINA.ZHS16GBK，这个要和数据库那边一致？

创建一个用户变量SQLPATH来指定sqlpath工具的文件路径，下载的第四个文件

OK，所有安装就此。

再安装Oracle的访问工具，我使用的是Navicat for Oracle工具
1. 普通安装
2. 破解、注解
3. 非常重要：在软件的option中OCI选项中将OCI library（oci.dll）的路径指向安装的instant clent的oci.dll上
4. SQL*PLUS以相同方式处理，不过不用这个的话初步处理无所谓了。

好了，可以尝试你的第一次Oracle连接之旅了（是我的……）

posted @ 2013-12-17 20:16 Hallelujah 阅读(1216) | 评论 (0) | 编辑收藏

有效利用标准库提供的type_traits，让程序在编译时作出分支选择

CentOS 7安装EPEL Repo

使用Python通过Hive的Streaming来写UDF的一些记录

C++编译期契约之must_have_base

Vagrant启动自己CentOS的时候出现文件夹不能正常挂载

kivy的第一步------安装，与IDEA共同开发

Python特殊方法的操作符重载表

zeromq学习，第一章

Python的参数解包小技巧（使用容器作为参数时）

Oracle的编程准备工作：搭建本地的基本环境

导航

统计

常用链接

留言簿(1)

随笔分类(15)

随笔档案(14)

最新随笔

搜索

最新随笔

最新评论

阅读排行榜

评论排行榜