PHP源代码简单分析 [zt]

Published on 2006 - 08 - 15
    <p>原贴地址: <a href="http://x-space.discuz.net/space/html/95/22195_itemid_14752.html">http://x-space.discuz.net/space/html/95/22195_itemid_14752.html</a><br /><br />当前版本PHP5.1.4</p>
    <p>1. 目录结构 <br />   1. build 和编译有关的目录。 <br />   2. ext 扩展库代码,例如 Mysql、zlib、iconv 等我们熟悉的扩展库。 <br />   3. main 主目录。 <br />   4. sapi 和各种服务器的接口调用,例如apache、IIS等,也包含一般的fastcgi、cgi等。 <br />   5. win32 和 Windows 下编译 PHP 有关的脚本。用了 WSH。 <br />   6. Zend 文件夹核心的引擎。</p>
    <p>2. PHP使用Lex和Yacc对语法进行解析。<br />   在 Zend 目录下有两个文件 zend_language_parser.y 与 zend_language_scanner.l 他们是Lex和Yacc的脚本文件,通过这两个脚本文件生成对应的.c和.h文件,实际上这在 linux 下非常普遍,gcc 也使用它们产生语树。 </p>
    <p>3. PHP如何使用Mysql?<br />   ext 目录下有一个 mysql 子目录,这个目录中的php_mysql.c 和 php_mysql.h 负责 PHP 与 Mysql 操作。使用了 Mysql 手册中的 C 语言 API。 </p>
    <p>4. 安全模式?<br />   main 文件夹下的safe_mode.h 和 safe_mode.c 文件负责PHP的安全模式。<br />5. 那些是 PHP 的标准函数,那些是扩展函数?<br />   ext 目录下英文意思是扩展,而在 ext 下还是有一个 standard 文件夹,存放着 PHP 中的标准函数,例如 explode 这个函数是在 ./ext/standard/string.c 下定义的。<br />6. PHP 源代码中的PHP_FUNCTION(xx) 宏。<br />   这个宏用来检验一个函数名称是否合法。合法的函数名称应该由小写字母及下划线组成。<br />7. 那些函数集是标准的?<br />   通过 ./ext/standard/ 目录我们可以看到以下常用函数集是标准的。字符串函数集、数组函数集、文件及目录操作函数集、md5算法等。<br />8. 一些函数的实现过程<br />   1. fsockopen, pfsockopen 的实现<br />      这两个函数的实现离不开 ./ext/standard/fsock.c 文件中的 php_fsockopen_stream 函数。具体的socket都在./main/network.c 中实现。<br />9. PHP 函数集注册过程<br />   在./main/internal_functions.c 中有一个数组 php_builtin_extensions 默认下有以下成员:<br />   <br />   1. phpext_bcmath_ptr<br />   2. phpext_calendar_ptr<br />   3. phpext_com_dotnet_ptr<br />   4. phpext_ctype_ptr<br />   5. phpext_date_ptr<br />   6. phpext_ftp_ptr<br />   7. phpext_hash_ptr<br />   8. phpext_odbc_ptr<br />   9. phpext_pcre_ptr<br />   10. phpext_reflection_ptr<br />   11. phpext_session_ptr<br />   12. phpext_spl_ptr<br />   13. phpext_standard_ptr<br />   14. phpext_tokenizer_ptr<br />   15. phpext_zlib_ptr<br />   <br />   接着 php_register_extensions(php_builtin_extensions, EXTCOUNT TSRMLS_CC) 进行注册<br />   <br />10. 有趣的Zend LOGO图片<br />       ./main/logos.h 文件中,用 zend_logo 与 php_logo 数组保存了 PHP 标志和 Zend 标志。所以你根本在发行包里找不到zend.gif。<br />11. PHP的语法树?<br />   <br />    1. Lex与Yacc<br />       市面上有这本书。大家可以买来看看,包括GCC都是用它们兄弟生成的语法树。如果对编译器感兴趣。可以翻阅市面上关于这方面的书,并不多就几本。<br />    <br />    2. .l与.y语法树文件<br />       ./Zend/zend_language_scanner.l与./Zend/zend_language_parser.y 规定了PHP的语法。从字面意义上scanner表示语法初步扫描,parser表示语法解析。根据这两个文件lex与yacc可以生成对应的c代码。所以相对来说生成语法是很方便的。<br />   <br />    3. 如何定义一个符号<br />       例如 if($language='php') 这一句中的if 就是一个token 语法中我们用T_IF表示。具体在.l文件中如下定义了:<br />       </p>
    <div style="BORDER-RIGHT: #cccccc 1px solid; PADDING-RIGHT: 5px; BORDER-TOP: #cccccc 1px solid; PADDING-LEFT: 4px; FONT-SIZE: 13px; PADDING-BOTTOM: 4px; BORDER-LEFT: #cccccc 1px solid; WIDTH: 98%; WORD-BREAK: break-all; PADDING-TOP: 4px; BORDER-BOTTOM: #cccccc 1px solid; BACKGROUND-COLOR: #eeeeee">
            <span style="COLOR: #000000">       &lt;</span>
            <span style="COLOR: #000000">ST_IN_SCRIPTING</span>
            <span style="COLOR: #000000">&gt;</span>
            <span style="COLOR: #000000">"</span>
            <span style="COLOR: #000000">if</span>
            <span style="COLOR: #000000">"</span>
            <span style="COLOR: #000000"> {<br />              </span>
            <span style="COLOR: #0000ff">return</span>
            <span style="COLOR: #000000"> T_IF;<br />      }<br /></span>
    </div>
    <p>      这样.php文件中的if就会被翻译成内置符号T_IF。’(单引号)被如下定义:<br /></p>
    <div style="BORDER-RIGHT: #cccccc 1px solid; PADDING-RIGHT: 5px; BORDER-TOP: #cccccc 1px solid; PADDING-LEFT: 4px; FONT-SIZE: 13px; PADDING-BOTTOM: 4px; BORDER-LEFT: #cccccc 1px solid; WIDTH: 98%; WORD-BREAK: break-all; PADDING-TOP: 4px; BORDER-BOTTOM: #cccccc 1px solid; BACKGROUND-COLOR: #eeeeee">
            <span style="COLOR: #000000">      </span>
            <span style="COLOR: #000000">&lt;</span>
            <span style="COLOR: #000000">ST_SINGLE_QUOTE</span>
            <span style="COLOR: #000000">&gt;</span>
            <span style="COLOR: #000000">[</span>
            <span style="COLOR: #000000">'</span>
            <span style="COLOR: #000000">] {<br />            BEGIN(ST_IN_SCRIPTING);<br />            return </span>
            <span style="COLOR: #000000">'</span>
            <span style="COLOR: #000000">\</span>
            <span style="COLOR: #000000">''</span>
            <span style="COLOR: #000000">;<br />      }<br /></span>
    </div>
    <p>      <br />   4. 复合符号例如最常见的变量命名$discuz_user, $submit 等。<br /></p>
    <div style="BORDER-RIGHT: #cccccc 1px solid; PADDING-RIGHT: 5px; BORDER-TOP: #cccccc 1px solid; PADDING-LEFT: 4px; FONT-SIZE: 13px; PADDING-BOTTOM: 4px; BORDER-LEFT: #cccccc 1px solid; WIDTH: 98%; WORD-BREAK: break-all; PADDING-TOP: 4px; BORDER-BOTTOM: #cccccc 1px solid; BACKGROUND-COLOR: #eeeeee">
            <span style="COLOR: #000000">      </span>
            <span style="COLOR: #000000">&lt;</span>
            <span style="COLOR: #000000">ST_IN_SCRIPTING</span>
            <span style="COLOR: #000000">,</span>
            <span style="COLOR: #000000">ST_DOUBLE_QUOTES</span>
            <span style="COLOR: #000000">,</span>
            <span style="COLOR: #000000">ST_HEREDOC</span>
            <span style="COLOR: #000000">,</span>
            <span style="COLOR: #000000">ST_BACKQUOTE</span>
            <span style="COLOR: #000000">&gt;</span>
            <span style="COLOR: #000000">"</span>
            <span style="COLOR: #000000">$</span>
            <span style="COLOR: #000000">"</span>
            <span style="COLOR: #000000">{LABEL} {<br />            zend_copy_value(zendlval</span>
            <span style="COLOR: #000000">,</span>
            <span style="COLOR: #000000"> (yytext</span>
            <span style="COLOR: #000000">+</span>
            <span style="COLOR: #000000">1</span>
            <span style="COLOR: #000000">)</span>
            <span style="COLOR: #000000">,</span>
            <span style="COLOR: #000000"> (yyleng</span>
            <span style="COLOR: #000000">-</span>
            <span style="COLOR: #000000">1</span>
            <span style="COLOR: #000000">));<br />            zendlval</span>
            <span style="COLOR: #000000">-&gt;</span>
            <span style="COLOR: #000000">type </span>
            <span style="COLOR: #000000">=</span>
            <span style="COLOR: #000000"> </span>
            <span style="COLOR: #008080">IS_STRING</span>
            <span style="COLOR: #000000">;<br />            </span>
            <span style="COLOR: #0000ff">return</span>
            <span style="COLOR: #000000"> T_VARIABLE;<br />      }<br /></span>
    </div>
    <p>   <br />   5. 一个有效的if语句过程<br />      这个定义在zend_language_parser.y 189行:<br /></p>
    <div style="BORDER-RIGHT: #cccccc 1px solid; PADDING-RIGHT: 5px; BORDER-TOP: #cccccc 1px solid; PADDING-LEFT: 4px; FONT-SIZE: 13px; PADDING-BOTTOM: 4px; BORDER-LEFT: #cccccc 1px solid; WIDTH: 98%; WORD-BREAK: break-all; PADDING-TOP: 4px; BORDER-BOTTOM: #cccccc 1px solid; BACKGROUND-COLOR: #eeeeee">
            <span style="COLOR: #000000">      T_IF </span>
            <span style="COLOR: #000000">'</span>
            <span style="COLOR: #000000">(</span>
            <span style="COLOR: #000000">'</span>
            <span style="COLOR: #000000"> expr </span>
            <span style="COLOR: #000000">'</span>
            <span style="COLOR: #000000">)</span>
            <span style="COLOR: #000000">'</span>
            <span style="COLOR: #000000"> {<br />            zend_do_if_cond(</span>
            <span style="COLOR: #000000">&amp;</span>
            <span style="COLOR: #000000">$</span>
            <span style="COLOR: #000000">3</span>
            <span style="COLOR: #000000">,</span>
            <span style="COLOR: #000000"> </span>
            <span style="COLOR: #000000">&amp;</span>
            <span style="COLOR: #000000">$</span>
            <span style="COLOR: #000000">4</span>
            <span style="COLOR: #000000"> TSRMLS_CC);<br />      } statement {<br />            zend_do_if_after_statement(</span>
            <span style="COLOR: #000000">&amp;</span>
            <span style="COLOR: #000000">$</span>
            <span style="COLOR: #000000">4</span>
            <span style="COLOR: #000000">,</span>
            <span style="COLOR: #000000"> </span>
            <span style="COLOR: #000000">1</span>
            <span style="COLOR: #000000"> TSRMLS_CC);<br />      } elseif_list else_single {<br />            zend_do_if_end(TSRMLS_C);<br />      }<br />      </span>
            <span style="COLOR: #000000">|</span>
            <span style="COLOR: #000000"> T_IF </span>
            <span style="COLOR: #000000">'</span>
            <span style="COLOR: #000000">(</span>
            <span style="COLOR: #000000">'</span>
            <span style="COLOR: #000000"> expr </span>
            <span style="COLOR: #000000">'</span>
            <span style="COLOR: #000000">)</span>
            <span style="COLOR: #000000">'</span>
            <span style="COLOR: #000000"> </span>
            <span style="COLOR: #000000">'</span>
            <span style="COLOR: #000000">:</span>
            <span style="COLOR: #000000">'</span>
            <span style="COLOR: #000000"> {<br />            zend_do_if_cond(</span>
            <span style="COLOR: #000000">&amp;</span>
            <span style="COLOR: #000000">$</span>
            <span style="COLOR: #000000">3</span>
            <span style="COLOR: #000000">,</span>
            <span style="COLOR: #000000"> </span>
            <span style="COLOR: #000000">&amp;</span>
            <span style="COLOR: #000000">$</span>
            <span style="COLOR: #000000">4</span>
            <span style="COLOR: #000000"> TSRMLS_CC);<br />      } inner_statement_list {<br />            zend_do_if_after_statement(</span>
            <span style="COLOR: #000000">&amp;</span>
            <span style="COLOR: #000000">$</span>
            <span style="COLOR: #000000">4</span>
            <span style="COLOR: #000000">,</span>
            <span style="COLOR: #000000"> </span>
            <span style="COLOR: #000000">1</span>
            <span style="COLOR: #000000"> TSRMLS_CC);<br />      } new_elseif_list new_else_single T_ENDIF </span>
            <span style="COLOR: #000000">'</span>
            <span style="COLOR: #000000">;</span>
            <span style="COLOR: #000000">'</span>
            <span style="COLOR: #000000"> {<br />            zend_do_if_end(TSRMLS_C);<br />      }<br /></span>
    </div>
    <p>      if 后面必须存在(),圆括弧里面是表达式 expr 表达式在734行被定义:<br /></p>
    <div style="BORDER-RIGHT: #cccccc 1px solid; PADDING-RIGHT: 5px; BORDER-TOP: #cccccc 1px solid; PADDING-LEFT: 4px; FONT-SIZE: 13px; PADDING-BOTTOM: 4px; BORDER-LEFT: #cccccc 1px solid; WIDTH: 98%; WORD-BREAK: break-all; PADDING-TOP: 4px; BORDER-BOTTOM: #cccccc 1px solid; BACKGROUND-COLOR: #eeeeee">
            <span style="COLOR: #000000">      expr:<br />            r_variable { $$ </span>
            <span style="COLOR: #000000">=</span>
            <span style="COLOR: #000000"> $</span>
            <span style="COLOR: #000000">1</span>
            <span style="COLOR: #000000">; }<br />            </span>
            <span style="COLOR: #000000">|</span>
            <span style="COLOR: #000000"> expr_without_variable { $$ </span>
            <span style="COLOR: #000000">=</span>
            <span style="COLOR: #000000"> $</span>
            <span style="COLOR: #000000">1</span>
            <span style="COLOR: #000000">; }<br />      ;</span>
    </div>
    <p>
            <br />      if 后面可以跟 elseif 语句及 else 语句。<br />      从语法树里面我们看出 if () 后面是可以跟 : 的,这一般很少被使用吧。</p>
    <p>   6. 优先级和左右结合性<br />      一般情况下.y文件中最先定义的操作符优先级相对低,并且可以使用%left、%right 进行描述左右结合性,例如:<br /></p>
    <div style="BORDER-RIGHT: #cccccc 1px solid; PADDING-RIGHT: 5px; BORDER-TOP: #cccccc 1px solid; PADDING-LEFT: 4px; FONT-SIZE: 13px; PADDING-BOTTOM: 4px; BORDER-LEFT: #cccccc 1px solid; WIDTH: 98%; WORD-BREAK: break-all; PADDING-TOP: 4px; BORDER-BOTTOM: #cccccc 1px solid; BACKGROUND-COLOR: #eeeeee">
            <span style="COLOR: #000000">      </span>
            <span style="COLOR: #000000">%</span>
            <span style="COLOR: #000000">left </span>
            <span style="COLOR: #000000">'</span>
            <span style="COLOR: #000000">+</span>
            <span style="COLOR: #000000">'</span>
            <span style="COLOR: #000000"> </span>
            <span style="COLOR: #000000">'</span>
            <span style="COLOR: #000000">-</span>
            <span style="COLOR: #000000">'</span>
            <span style="COLOR: #000000"> </span>
            <span style="COLOR: #000000">'</span>
            <span style="COLOR: #000000">.</span>
            <span style="COLOR: #000000">'</span>
            <span style="COLOR: #000000">
                    <br />      </span>
            <span style="COLOR: #000000">%</span>
            <span style="COLOR: #000000">left </span>
            <span style="COLOR: #000000">'</span>
            <span style="COLOR: #000000">*</span>
            <span style="COLOR: #000000">'</span>
            <span style="COLOR: #000000"> </span>
            <span style="COLOR: #000000">'</span>
            <span style="COLOR: #000000">/</span>
            <span style="COLOR: #000000">'</span>
            <span style="COLOR: #000000"> </span>
            <span style="COLOR: #000000">'</span>
            <span style="COLOR: #000000">%</span>
            <span style="COLOR: #000000">'</span>
            <span style="COLOR: #000000">
                    <br />      </span>
            <span style="COLOR: #000000">%</span>
            <span style="COLOR: #000000">right </span>
            <span style="COLOR: #000000">'</span>
            <span style="COLOR: #000000">!</span>
            <span style="COLOR: #000000">'</span>
    </div>
    <p>
            <br />      这说明'!'在 PHP 语法中是右结合的, '*' '/' '%' '+' '-' '.' 是左结合的,并且'!'的优先级更高<br />      例如语法 !$a + $b 要先计算 !$a 在进行加法操作<br />      %left ',' 被放在最上面定义,说明他的优先级最低,因为我们知道','可以等同一个语句。</p>
    <p>   7. php.ini的解析 </p>
    <p>      1. 如果规定数值正负?<br /></p>
    <div style="BORDER-RIGHT: #cccccc 1px solid; PADDING-RIGHT: 5px; BORDER-TOP: #cccccc 1px solid; PADDING-LEFT: 4px; FONT-SIZE: 13px; PADDING-BOTTOM: 4px; BORDER-LEFT: #cccccc 1px solid; WIDTH: 98%; WORD-BREAK: break-all; PADDING-TOP: 4px; BORDER-BOTTOM: #cccccc 1px solid; BACKGROUND-COLOR: #eeeeee">
            <span style="COLOR: #000000">        </span>
            <span style="COLOR: #000000">&lt;</span>
            <span style="COLOR: #000000"> INITIAL </span>
            <span style="COLOR: #000000">&gt;</span>
            <span style="COLOR: #000000"> [ ] </span>
            <span style="COLOR: #000000">*</span>
            <span style="COLOR: #000000"> ( </span>
            <span style="COLOR: #000000">"</span>
            <span style="COLOR: #000000"> true </span>
            <span style="COLOR: #000000">"</span>
            <span style="COLOR: #000000"> </span>
            <span style="COLOR: #000000">|</span>
            <span style="COLOR: #000000"> </span>
            <span style="COLOR: #000000">"</span>
            <span style="COLOR: #000000"> on </span>
            <span style="COLOR: #000000">"</span>
            <span style="COLOR: #000000"> </span>
            <span style="COLOR: #000000">|</span>
            <span style="COLOR: #000000"> </span>
            <span style="COLOR: #000000">"</span>
            <span style="COLOR: #000000"> yes </span>
            <span style="COLOR: #000000">"</span>
            <span style="COLOR: #000000"> )[ ] </span>
            <span style="COLOR: #000000">*</span>
            <span style="COLOR: #000000">  {<br />              ini_lval </span>
            <span style="COLOR: #000000">-&gt;</span>
            <span style="COLOR: #000000"> value </span>
            <span style="COLOR: #000000">.</span>
            <span style="COLOR: #000000"> str </span>
            <span style="COLOR: #000000">.</span>
            <span style="COLOR: #000000"> val  </span>
            <span style="COLOR: #000000">=</span>
            <span style="COLOR: #000000">  zend_strndup( </span>
            <span style="COLOR: #000000">"</span>
            <span style="COLOR: #000000"> 1 </span>
            <span style="COLOR: #000000">"</span>
            <span style="COLOR: #000000"> </span>
            <span style="COLOR: #000000">,</span>
            <span style="COLOR: #000000">   </span>
            <span style="COLOR: #000000">1</span>
            <span style="COLOR: #000000"> );<br />              ini_lval </span>
            <span style="COLOR: #000000">-&gt;</span>
            <span style="COLOR: #000000"> value </span>
            <span style="COLOR: #000000">.</span>
            <span style="COLOR: #000000"> str </span>
            <span style="COLOR: #000000">.</span>
            <span style="COLOR: #000000"> len  </span>
            <span style="COLOR: #000000">=</span>
            <span style="COLOR: #000000">   </span>
            <span style="COLOR: #000000">1</span>
            <span style="COLOR: #000000"> ;<br />              ini_lval </span>
            <span style="COLOR: #000000">-&gt;</span>
            <span style="COLOR: #000000"> type  </span>
            <span style="COLOR: #000000">=</span>
            <span style="COLOR: #000000">   </span>
            <span style="COLOR: #008080">IS_STRING</span>
            <span style="COLOR: #000000"> ;<br />               </span>
            <span style="COLOR: #0000ff">return</span>
            <span style="COLOR: #000000">  CFG_TRUE;<br />      }<br /><br />       </span>
            <span style="COLOR: #000000">&lt;</span>
            <span style="COLOR: #000000"> INITIAL </span>
            <span style="COLOR: #000000">&gt;</span>
            <span style="COLOR: #000000"> [ ] </span>
            <span style="COLOR: #000000">*</span>
            <span style="COLOR: #000000"> ( </span>
            <span style="COLOR: #000000">"</span>
            <span style="COLOR: #000000"> false </span>
            <span style="COLOR: #000000">"</span>
            <span style="COLOR: #000000"> </span>
            <span style="COLOR: #000000">|</span>
            <span style="COLOR: #000000"> </span>
            <span style="COLOR: #000000">"</span>
            <span style="COLOR: #000000"> off </span>
            <span style="COLOR: #000000">"</span>
            <span style="COLOR: #000000"> </span>
            <span style="COLOR: #000000">|</span>
            <span style="COLOR: #000000"> </span>
            <span style="COLOR: #000000">"</span>
            <span style="COLOR: #000000"> no </span>
            <span style="COLOR: #000000">"</span>
            <span style="COLOR: #000000"> </span>
            <span style="COLOR: #000000">|</span>
            <span style="COLOR: #000000"> </span>
            <span style="COLOR: #000000">"</span>
            <span style="COLOR: #000000"> none </span>
            <span style="COLOR: #000000">"</span>
            <span style="COLOR: #000000"> )[ ] </span>
            <span style="COLOR: #000000">*</span>
            <span style="COLOR: #000000">  {<br />              ini_lval </span>
            <span style="COLOR: #000000">-&gt;</span>
            <span style="COLOR: #000000"> value </span>
            <span style="COLOR: #000000">.</span>
            <span style="COLOR: #000000"> str </span>
            <span style="COLOR: #000000">.</span>
            <span style="COLOR: #000000"> val  </span>
            <span style="COLOR: #000000">=</span>
            <span style="COLOR: #000000">  zend_strndup( </span>
            <span style="COLOR: #000000">""</span>
            <span style="COLOR: #000000"> </span>
            <span style="COLOR: #000000">,</span>
            <span style="COLOR: #000000">   </span>
            <span style="COLOR: #000000">0</span>
            <span style="COLOR: #000000"> );<br />              ini_lval </span>
            <span style="COLOR: #000000">-&gt;</span>
            <span style="COLOR: #000000"> value </span>
            <span style="COLOR: #000000">.</span>
            <span style="COLOR: #000000"> str </span>
            <span style="COLOR: #000000">.</span>
            <span style="COLOR: #000000"> len  </span>
            <span style="COLOR: #000000">=</span>
            <span style="COLOR: #000000">   </span>
            <span style="COLOR: #000000">0</span>
            <span style="COLOR: #000000"> ;<br />              ini_lval </span>
            <span style="COLOR: #000000">-&gt;</span>
            <span style="COLOR: #000000"> type  </span>
            <span style="COLOR: #000000">=</span>
            <span style="COLOR: #000000">   </span>
            <span style="COLOR: #008080">IS_STRING</span>
            <span style="COLOR: #000000"> ;<br />               </span>
            <span style="COLOR: #0000ff">return</span>
            <span style="COLOR: #000000">  CFG_FALSE;<br />      }</span>
    </div>
Comments
Write a Comment