首页 > 代码库 > [笔记]一道C语言面试题:IPv4字符串转为UInt整数

[笔记]一道C语言面试题:IPv4字符串转为UInt整数

题目:输入一个IPv4字符串,如“1.2.3.4”,输出对应的无符号整数,如本例输出为 0x01020304。

来源:某500强企业面试题目

思路:从尾部扫描到头部,一旦发现无法转换,立即返回,减少无谓操作。

#include "stdio.h"#include "stdlib.h"#include "string.h"bool ConvertIPv4ToUInt(const char *strIP, unsigned int *ip){    if (!strIP) {        return false;    }    int Len = strlen(strIP);    // min len is 7, e.g. 1.2.3.4; max len is 15, e.g. 123.234.121.254    if ((Len < 7) || (Len > 15)) {        return false;    }    int num[4] = { 0 };     // 4 parts of number    int partNum = 0;        // 1 part of number     int base = 1;           // 10^base    int dotCount = 0;       // dot count    // from right to left    for (int i = Len - 1; i >= 0; --i) {        char ch = strIP[i];        if (ch == .) {            // if the first char of last char is ".", e.g. ".1.2.3.4" or "1.2.", exit            if ((i == 0) || (i == Len - 1)){                return false;            }            dotCount++;            // if more than 3 dot found, e.g. "1.2.3.4.5", exit            if (dotCount > 3) {                return false;            }            // save partNum to num[]            num[dotCount - 1] = partNum;            partNum = 0;            base = 1;        }        else if ((ch < 0) || (ch > 9)) {            // if illeagal char inside, exit            return false;        }        else {            // handle digit char            partNum += (ch - 0) * base;            base *= 10;            if (partNum > 255) {                return false;            }            // handle first part num            if (i == 0) {                // if count of "." is not enough, exit                if (dotCount != 3) {                    return false;                }                num[dotCount] = partNum;            }        }    }    // output ip    *ip = 0;    for (int i = 0; i < 4; ++i) {        *ip += num[i] << (i * 8);    }    return true;}int main(int argc, char* argv[]){    char* strIP[] = {        "1",        "1.2",        "1.2.3",        "111.222.113",         "1.2.3.",        ".1.2.3",        "256.1.2.3",        "1.2.3.4",        "1.2.3.4.5",        "12.234.45.6",        "12.2345.45.6",        "1.a.2.3",        "1.2.3.4 ",        "1.2. 3.4",        "1,2,3,4",    };    for (int i = 0; i < sizeof(strIP) / sizeof(char *); ++i){        unsigned int ip = 0;        if (ConvertIPv4ToUInt(strIP[i], &ip)){            printf("%s -> %08X\n", strIP[i], ip);        }        else {            printf("%s is not valid\n", strIP[i]);        }    }    getchar();    return 0;}

输出结果为:

1 is not valid1.2 is not valid1.2.3 is not valid111.222.113 is not valid1.2.3. is not valid.1.2.3 is not valid256.1.2.3 is not valid1.2.3.4 -> 010203041.2.3.4.5 is not valid12.234.45.6 -> 0CEA2D0612.2345.45.6 is not valid1.a.2.3 is not valid1.2.3.4  is not valid1.2. 3.4 is not valid1,2,3,4 is not valid

 

从工程化角度考虑,有几点需要注意:

1、输入的字符串是否有效?
    不但要判断输入字符串是否为空,还要在处理过程中随时检查中间结果值,快速返回。
    需要考虑“.”的非法位置,如开头和结尾不能有“.”。
    需要考虑某段数字过长(超过255)。
    需要考虑“.”的个数,必须有且只有3个。

2、快速识别错误并退出
    发现有问题就快速退出,不需要进行无谓的多余计算。

3、考虑到转换失败的情况,所以返回值设定为bool,通过参数指针来返回转换结果。
    如果设定UInt为返回值,则无法通过返回值判断转换是否成功。
    需要的话,可以将bool的返回值改为enum,从而返回各种错误类型供调用者使用。

 

从编程角度考虑,有几点需要注意:

1、从后向前扫描字符串时,需要注意处理顺序
    先判断字符是否为“.”,然后判断是否为非数字,剩下的就是数字了。
    这样的顺序逻辑清晰,便于在发现问题时快速退出。

2、对于类似问题,可以将测试集先列出来,写代码时候就可以有的放矢的进行容错处理了。