示例: 编码为S表达式
Display 是一个用于显示结构化数据的调试工具,但是它并不能将任意的 Go 语言对象编码为通用消息然后用于进程间通信。
正如我们在4.5节中中看到的,Go 语言的标准库支持了包括 JSON、XML 和 ASN.1 等多种编码格式。还有另一种依然被广泛使用的格式是 S 表达式格式,采用 Lisp 语言的语法。但是和其他编码格式不同的是,Go 语言自带的标准库并不支持 S 表达式,主要是因为它没有一个公认的标准规范。
在本节中,我们将定义一个包用于将任意的 Go 语言对象编码为 S 表达式格式,它支持以下结构:
42 integer
"hello" string(带有Go风格的引号)
foo symbol(未用引号括起来的名字)
(1 2 3) list (括号包起来的0个或多个元素)
布尔型习惯上使用 t 符号表示 true,空列表或 nil 符号表示 false,但是为了简单起见,我们暂时忽略布尔类型。同时忽略的还有 chan 管道和函数,因为通过反射并无法知道它们的确切状态。我们忽略的还有浮点数、复数和 interface。支持它们是练习12.3的任务。
我们将 Go 语言的类型编码为 S 表达式的方法如下。整数和字符串以显而易见的方式编码。空值编码为 nil 符号。数组和 slice 被编码为列表。
结构体被编码为成员对象的列表,每个成员对象对应一个有两个元素的子列表,子列表的第一个元素是成员的名字,第二个元素是成员的值。Map 被编码为键值对的列表。传统上,S 表达式使用点状符号列表 (key . value) 结构来表示 key/value 对,而不是用一个含双元素的列表,不过为了简单我们忽略了点状符号列表。
编码是由一个 encode 递归函数完成,如下所示。它的结构本质上和前面的 Display 函数类似:
Unresolved include directive in modules/ROOT/pages/ch12/ch12-04.adoc - include::example$/ch12/sexpr/encode.go[]
Marshal 函数是对 encode 的包装,以保持和 encoding/… 下其它包有着相似的 API:
Unresolved include directive in modules/ROOT/pages/ch12/ch12-04.adoc - include::example$/ch12/sexpr/encode.go[]
下面是 Marshal 对 12.3 节的 strangelove 变量编码后的结果:
((Title "Dr. Strangelove") (Subtitle "How I Learned to Stop Worrying and Lo
ve the Bomb") (Year 1964) (Actor (("Grp. Capt. Lionel Mandrake" "Peter Sell
ers") ("Pres. Merkin Muffley" "Peter Sellers") ("Gen. Buck Turgidson" "Geor
ge C. Scott") ("Brig. Gen. Jack D. Ripper" "Sterling Hayden") ("Maj. T.J. \
"King\" Kong" "Slim Pickens") ("Dr. Strangelove" "Peter Sellers"))) (Oscars
("Best Actor (Nomin.)" "Best Adapted Screenplay (Nomin.)" "Best Director (N
omin.)" "Best Picture (Nomin.)")) (Sequel nil))
整个输出编码为一行中以减少输出的大小,但是也很难阅读。下面是对 S 表达式手动格式化的结果。编写一个 S 表达式的美化格式化函数将作为一个具有挑战性的练习任务;不过 http://gopl.io 也提供了一个简单的版本。
((Title "Dr. Strangelove")
(Subtitle "How I Learned to Stop Worrying and Love the Bomb")
(Year 1964)
(Actor (("Grp. Capt. Lionel Mandrake" "Peter Sellers")
("Pres. Merkin Muffley" "Peter Sellers")
("Gen. Buck Turgidson" "George C. Scott")
("Brig. Gen. Jack D. Ripper" "Sterling Hayden")
("Maj. T.J. \"King\" Kong" "Slim Pickens")
("Dr. Strangelove" "Peter Sellers")))
(Oscars ("Best Actor (Nomin.)"
"Best Adapted Screenplay (Nomin.)"
"Best Director (Nomin.)"
"Best Picture (Nomin.)"))
(Sequel nil))
和 fmt.Print、json.Marshal、Display 函数类似,sexpr.Marshal 函数处理带环的数据结构也会陷入死循环。
在12.6节中,我们将给出S表达式解码器的实现步骤,但是在那之前,我们还需要先了解如何通过反射技术来更新程序的变量。
练习 12.3: 实现 encode 函数缺少的分支。将布尔类型编码为 t 和 nil,浮点数编码为 Go 语言的格式,复数 1+2i 编码为 #C(1.0 2.0) 格式。接口编码为类型名和值对,例如("[]int" (1 2 3)),但是这个形式可能会造成歧义:reflect.Type.String 方法对于不同的类型可能返回相同的结果。
练习 12.4: 修改 encode 函数,以上面的格式化形式输出 S 表达式。
练习 12.5: 修改 encode 函数,用 JSON 格式代替 S 表达式格式。然后使用标准库提供的 json.Unmarshal 解码器来验证函数是正确的。
练习 12.6: 修改 encode,作为一个优化,忽略对是零值对象的编码。
练习 12.7: 创建一个基于流式的 API,用于 S 表达式的解码,和 json.Decoder(§4.5)函数功能类似。