<rss xmlns:atom="http://www.w3.org/2005/Atom" version="2.0"><channel><title>Dillon</title><link>https://dillonzq.com/</link><description>Dillon 的个人博客网站，用来分享一些随想和技术文章。</description><generator>Hugo -- gohugo.io</generator><language>zh-CN</language><managingEditor>dillonzq@outlook.com (Dillon)</managingEditor><webMaster>dillonzq@outlook.com (Dillon)</webMaster><copyright>This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.</copyright><lastBuildDate>Thu, 08 Aug 2019 20:30:18 +0800</lastBuildDate><atom:link href="https://dillonzq.com/index.xml" rel="self" type="application/rss+xml"/><item><title>C 语言内联汇编</title><link>https://dillonzq.com/2019/08/c-%E8%AF%AD%E8%A8%80%E5%86%85%E8%81%94%E6%B1%87%E7%BC%96/</link><pubDate>Thu, 08 Aug 2019 20:30:18 +0800</pubDate><author>Dillon</author><guid>https://dillonzq.com/2019/08/c-%E8%AF%AD%E8%A8%80%E5%86%85%E8%81%94%E6%B1%87%E7%BC%96/</guid><description><![CDATA[<h2 id="1-简介">1. 简介</h2>
<p>本文介绍了 GCC/Clang 提供的 C 语言内联汇编特性的用途和用法。
对于 C 语言编程来说，<strong><ruby>内联汇编<rt>Inline Assembler</rt></ruby></strong> 并不是一个新特性，它可以帮助我们充分利用计算机的性能。
大多数情况下很少有机会实际使用该特性。事实上，内联汇编只为特定的要求提供服务，特别是在涉及底层的系统编程时。</p>
<p>本文大量参考了 <a href="http://www.ibiblio.org/gferg/ldp/GCC-Inline-Assembly-HOWTO.html" target="_blank" rel="noopener noreffer ">GCC-Inline-Assembly-HOWTO</a> 以及
<a href="https://linux.cn" target="_blank" rel="noopener noreffer ">Linux 中国</a> 的译文 <a href="https://linux.cn/article-7688-1.html" target="_blank" rel="noopener noreffer ">GCC 内联汇编 HOWTO</a>，
在此感谢他们的辛苦劳动。</p>
<h2 id="2-内联函数与内联汇编">2. 内联函数与内联汇编</h2>
<p>C 语言标准<sup id="fnref:1"><a href="#fn:1" class="footnote-ref" role="doc-noteref">1</a></sup> 提供的函数声明的关键字 <code>inline</code> 使我们可以要求编译器将一个函数的代码直接插入到函数被实际调用的地方。
这样的函数被称作<strong><ruby>内联函数<rt>Inline Function</rt></ruby></strong>（又称<strong>在线函数</strong>或<strong>编译时期展开函数</strong>），类似于 <strong><ruby>宏<rt>macro</rt></ruby></strong>，
不同之处在于内联函数是在编译期完成，而宏是在预处理阶段直接修改。</p>
<p>内联函数的有什么优点呢？</p>
<p>最主要的优点是可以减少函数调用开销。
同时，如果所有实参的值为常量，它们的已知值可以在编译期被简化，因此并非所有的内联函数代码都会被包含进去。
内联函数对于代码大小的影响是不可预测的，这取决于特定的情况。</p>
<p>而内联汇编是将一些 <strong><ruby>汇编语言<rt>Assembly Language</rt></ruby></strong> 的指令以内联函数的形式写入 C 语言代码中，
并且可以通过 C 语言的变量输入/输出，实现了汇编语言和 C 语言语言的联合编程。
为了使用内联汇编，GCC<sup id="fnref:2"><a href="#fn:2" class="footnote-ref" role="doc-noteref">2</a></sup> 和 Clang<sup id="fnref:3"><a href="#fn:3" class="footnote-ref" role="doc-noteref">3</a></sup> 均提供了 <code>asm</code> 关键词。</p>
<p>内联汇编既有内联函数的内联特性，又可以充分利用计算机性能。
但是，内联汇编但缺点也很明显，受限于汇编语言的硬件相关性，包含内联汇编的代码通常不具备良好的跨平台特性。<sup id="fnref:4"><a href="#fn:4" class="footnote-ref" role="doc-noteref">4</a></sup></p>
<h2 id="3-汇编语法">3. 汇编语法</h2>
<p>当前版本的 <strong>GCC/GNU</strong> 编译器和 <strong>Clang/LLVM</strong> 编译器默认使用 <strong>AT&amp;T/UNIX</strong> 汇编语法，
GCC 可以通过加参数 <code>-masm=intel</code> 来使用 <strong>Intel</strong> 汇编语法，该参数并不适用于 Clang。</p>
<h3 id="31-attunix-和-intel-汇编语法的主要区别">3.1 AT&amp;T/UNIX 和 Intel 汇编语法的主要区别</h3>
<ol>
<li>
<p><strong><ruby>源操作数<rt>Source</rt></ruby></strong> 和 <strong><ruby>目的操作数<rt>Destination</rt></ruby></strong> 的顺序</p>
<p>AT&amp;T/UNIX 汇编语法的操作数顺序和 Intel 语法的正好相反。
在 AT&amp;T/UNIX 语法中，第一操作数为源操作数，第二操作数为目的操作数。
然而在 Intel 语法中，第一操作数为目的操作数，第二操作数为源操作数。
也就是说，AT&amp;T/UNIX 语法中的 <code>Op-code src dst</code> 在 Intel 语法中变为 <code>Op-code dst src</code>。</p>
</li>
<li>
<p><strong><ruby>寄存器<rt>Register</rt></ruby></strong> 命名不同</p>
<p>在 AT&amp;T/UNIX 语法中，寄存器名称有 <code>%</code> 前缀，即如果要使用 <code>eax</code> 寄存器，它应该写作 <code>%eax</code>。
然而在 Intel 语法中，寄存器名称没有 <code>%</code> 前缀。</p>
</li>
<li>
<p><code>$</code> 前缀和 <strong><ruby>立即数<rt>Immediate Operand</rt></ruby></strong> 格式</p>
<p>在 AT&amp;T/UNIX 语法中，C 语言的变量和立即数都以 <code>$</code> 作为前缀，同时常量立即数可以添加前缀 <code>0x</code> 表示十六进制。
然而在 Intel 语法中，C 语言的变量和常量立即数都没有 <code>$</code> 前缀，常量立即数以 <code>h</code> 为后缀来表示十六进制。</p>
</li>
<li>
<p><strong><ruby>存储器操作数<rt>Memory Operand</rt></ruby></strong> 大小的表示方法</p>
<p>在 AT&amp;T/UNIX 语法中，存储器操作数的大小取决于操作数名字的后缀。
后缀 <code>b</code>、<code>w</code>、<code>l</code> 分别指明了 <strong><ruby>字节<rt>byte</rt></ruby></strong>（8位）、<strong><ruby>字<rt>word</rt></ruby></strong>（16位）、<strong><ruby>长型<rt>long</rt></ruby></strong>（32位）的存储器引用。
然而在 Intel 语法中，通过给存储器操作数添加 <code>byte ptr</code>、 <code>word ptr</code> 和 <code>dword ptr</code> 的前缀来对应实现这一功能。
因此，AT&amp;T/UNIX 语法中的 <code>movb foo, %al</code> 在 Intel 语法中变为 <code>mov al, byte ptr foo</code>。</p>
</li>
<li>
<p>其它关于操作数</p>
<p>在 AT&amp;T/UNIX 语法中，基址寄存器包含在 <code>(</code> 和 <code>)</code> 中，然而在 Intel 语法中，它们变为 <code>[</code> 和 <code>]</code>。
另外，在 AT&amp;T/UNIX 语法中，间接内存引用表示为 <code>section:disp(base, index, scale)</code>，而在 Intel 语法中变为 <code>section:[base + index*scale + disp]</code>。
需要牢记的一点是，在 AT&amp;T/UNIX 语法中，当一个立即数用于 <code>disp</code> 或 <code>scale</code> 时，不能添加 <code>$</code> 前缀。</p>
</li>
</ol>
<p>以上是关于 AT&amp;T/UNIX 语法和 Intel 语法的一些主要区别，为了更好理解，下面列举一些示例代码。</p>
<table>
<thead>
<tr>
<th style="text-align:left">Intel Code</th>
<th style="text-align:left">AT&amp;T/UNIX Code</th>
</tr>
</thead>
<tbody>
<tr>
<td style="text-align:left"><code>mov     eax, 1</code></td>
<td style="text-align:left"><code>movl    $1, %eax</code></td>
</tr>
<tr>
<td style="text-align:left"><code>mov     ebx, 0ffh</code></td>
<td style="text-align:left"><code>movl    $0xff, %ebx</code></td>
</tr>
<tr>
<td style="text-align:left"><code>int     80h</code></td>
<td style="text-align:left"><code>int     $0x80</code></td>
</tr>
<tr>
<td style="text-align:left"><code>mov     ebx, eax</code></td>
<td style="text-align:left"><code>movl    %eax, %ebx</code></td>
</tr>
<tr>
<td style="text-align:left"><code>mov     eax, [ecx]</code></td>
<td style="text-align:left"><code>movl    (%ecx), %eax</code></td>
</tr>
<tr>
<td style="text-align:left"><code>mov     eax, [ebx+3]</code></td>
<td style="text-align:left"><code>movl    3(%ebx), %eax</code></td>
</tr>
<tr>
<td style="text-align:left"><code>mov     eax, [ebx+20h]</code></td>
<td style="text-align:left"><code>movl    0x20(%ebx), %eax</code></td>
</tr>
<tr>
<td style="text-align:left"><code>add     eax, [ebx+ecx*2h]</code></td>
<td style="text-align:left"><code>addl    (%ebx, %ecx, 0x2), %eax</code></td>
</tr>
<tr>
<td style="text-align:left"><code>lea     eax, [ebx+ecx]</code></td>
<td style="text-align:left"><code>leal    (%ebx, %ecx), %eax</code></td>
</tr>
<tr>
<td style="text-align:left"><code>sub     eax, [ebx+ecx*4h-20h]</code></td>
<td style="text-align:left"><code>subl    -0x20(%ebx, %ecx, 0x4), %eax</code></td>
</tr>
</tbody>
</table>
<p>关于更完整的汇编语法，请参考 GNU 汇编部分文档。
由于 AT&amp;T/UNIX 语法使用更广泛，本文以下关于内联汇编的介绍均以 AT&amp;T/UNIX 语法作为示例。</p>
<h2 id="4-c-语言内联汇编的语法">4. C 语言内联汇编的语法</h2>
<p>GCC/Clang 提供的关键字 <code>asm</code> 可以直接用来使用内联汇编代码，<code>__asm__</code> 是它的别名，可以避免 <code>asm</code> 与其它标识符冲突。</p>
<p>GCC/Clang 提供了两种内联汇编的使用方法，分别是 <strong><ruby>基本汇编<rt>Basic Asm</rt></ruby></strong> 和 <strong><ruby>扩展汇编<rt>Extended Asm</rt></ruby></strong>。</p>
<h3 id="41-基本汇编">4.1 基本汇编</h3>
<p>基本汇编的语法直接了当。它的基本格式为</p>
<div class="highlight"><div class="chroma">
<table class="lntable"><tr><td class="lntd">
<pre tabindex="0" class="chroma"><code><span class="lnt">1
</span></code></pre></td>
<td class="lntd">
<pre tabindex="0" class="chroma"><code class="language-c" data-lang="c"><span class="line"><span class="cl"><span class="k">asm</span> <span class="p">(</span><span class="s">&#34;汇编代码&#34;</span><span class="p">);</span>
</span></span></code></pre></td></tr></table>
</div>
</div><p>示例代码：</p>
<div class="highlight"><div class="chroma">
<table class="lntable"><tr><td class="lntd">
<pre tabindex="0" class="chroma"><code><span class="lnt">1
</span><span class="lnt">2
</span></code></pre></td>
<td class="lntd">
<pre tabindex="0" class="chroma"><code class="language-c" data-lang="c"><span class="line"><span class="cl"><span class="k">asm</span> <span class="p">(</span><span class="s">&#34;movl %ecx %eax&#34;</span><span class="p">);</span>  <span class="cm">/* 将 ecx 寄存器的内容移至 eax */</span>
</span></span><span class="line"><span class="cl"><span class="k">asm</span> <span class="p">(</span><span class="s">&#34;movb %bh (%eax)&#34;</span><span class="p">);</span> <span class="cm">/* 将 bh 的一个字节数据 移至 eax 寄存器指向的内存 */</span>
</span></span></code></pre></td></tr></table>
</div>
</div><p>如果指令多于一条，可以一行一条，并用双引号圈起，同时为每条指令添加 <code>\n\t</code> 后缀。
这是因为 GCC 将每一条当作字符串发送给 <strong><ruby>GNU 汇编器<rt>GAS</rt></ruby></strong>，并且通过使用换行符/制表符发送正确格式化后的行给汇编器。</p>
<p>示例代码：</p>
<div class="highlight"><div class="chroma">
<table class="lntable"><tr><td class="lntd">
<pre tabindex="0" class="chroma"><code><span class="lnt">1
</span><span class="lnt">2
</span><span class="lnt">3
</span><span class="lnt">4
</span></code></pre></td>
<td class="lntd">
<pre tabindex="0" class="chroma"><code class="language-c" data-lang="c"><span class="line"><span class="cl"><span class="k">asm</span> <span class="p">(</span><span class="s">&#34;movl %eax, %ebx</span><span class="se">\n\t</span><span class="s">&#34;</span>
</span></span><span class="line"><span class="cl">     <span class="s">&#34;movl $56, %esi</span><span class="se">\n\t</span><span class="s">&#34;</span>
</span></span><span class="line"><span class="cl">     <span class="s">&#34;movl %ecx, $label(%edx,%ebx,$4)</span><span class="se">\n\t</span><span class="s">&#34;</span>
</span></span><span class="line"><span class="cl">     <span class="s">&#34;movb %ah, (%ebx)&#34;</span><span class="p">);</span>
</span></span></code></pre></td></tr></table>
</div>
</div><p>如果在汇编代码中涉及到一些寄存器，即改变其内容，在没有恢复这些变化的情况下从汇编中返回，会导致一些意想不到的事情。
这是因为 GCC 并不知道寄存器内容的变化，这会导致不可预料的问题，特别是当编译器做了某些优化时。
因此在基本汇编中通常只能使用没有副作用的指令。如果想要使用改变寄存器的指令，则需要在内联汇编退出时恢复这些寄存器。
扩展汇编给我们提供了这个功能。</p>
<h3 id="42-扩展汇编">4.2 扩展汇编</h3>
<p>在扩展汇编中，我们可以同时指定操作数。它允许我们指定输入寄存器、输出寄存器以及修饰寄存器列表。
GCC 不强制用户必须指定使用的寄存器。可以把头疼的事留给 GCC，这可能可以更好地适应 GCC 的优化。</p>
<p>扩展汇编的基本格式为：</p>
<div class="highlight"><div class="chroma">
<table class="lntable"><tr><td class="lntd">
<pre tabindex="0" class="chroma"><code><span class="lnt">1
</span><span class="lnt">2
</span><span class="lnt">3
</span><span class="lnt">4
</span><span class="lnt">5
</span></code></pre></td>
<td class="lntd">
<pre tabindex="0" class="chroma"><code class="language-c" data-lang="c"><span class="line"><span class="cl"><span class="k">asm</span> <span class="p">(</span> <span class="err">汇编程序模板</span>
</span></span><span class="line"><span class="cl">    <span class="o">:</span> <span class="err">输出操作数</span>     <span class="cm">/* 可选的 */</span>
</span></span><span class="line"><span class="cl">    <span class="o">:</span> <span class="err">输入操作数</span>     <span class="cm">/* 可选的 */</span>
</span></span><span class="line"><span class="cl">    <span class="o">:</span> <span class="err">修饰寄存器列表</span>  <span class="cm">/* 可选的 */</span>
</span></span><span class="line"><span class="cl">    <span class="p">);</span>
</span></span></code></pre></td></tr></table>
</div>
</div><p>汇编程序模板由汇编指令组成。每一个操作数由一个操作数约束字符串所描述，其后紧接一个括弧括起的 C 语言表达式。
冒号用于将汇编程序模板和第一个输出操作数分开，另一个（冒号）用于将最后一个输出操作数和第一个输入操作数分开（如果存在的话）。
逗号用于分离每一个组内的操作数。总操作数的数目限制在 10 个，或者机器描述中的任何指令格式中的最大操作数数目，以较大者为准。
如果没有输出操作数但存在输入操作数，你必须将两个连续的冒号放置于输出操作数原本会放置的地方周围。</p>
<p>示例代码：</p>
<div class="highlight"><div class="chroma">
<table class="lntable"><tr><td class="lntd">
<pre tabindex="0" class="chroma"><code><span class="lnt">1
</span><span class="lnt">2
</span><span class="lnt">3
</span><span class="lnt">4
</span><span class="lnt">5
</span><span class="lnt">6
</span><span class="lnt">7
</span></code></pre></td>
<td class="lntd">
<pre tabindex="0" class="chroma"><code class="language-c" data-lang="c"><span class="line"><span class="cl"><span class="k">asm</span> <span class="p">(</span><span class="s">&#34;cld</span><span class="se">\n\t</span><span class="s">&#34;</span>
</span></span><span class="line"><span class="cl">     <span class="s">&#34;rep</span><span class="se">\n\t</span><span class="s">&#34;</span>
</span></span><span class="line"><span class="cl">     <span class="s">&#34;stosl&#34;</span>
</span></span><span class="line"><span class="cl">    <span class="o">:</span>                                       <span class="cm">/* 无输出 */</span>
</span></span><span class="line"><span class="cl">    <span class="o">:</span><span class="s">&#34;c&#34;</span><span class="p">(</span><span class="n">count</span><span class="p">),</span> <span class="s">&#34;a&#34;</span><span class="p">(</span><span class="n">fill_value</span><span class="p">),</span> <span class="s">&#34;D&#34;</span><span class="p">(</span><span class="n">dest</span><span class="p">)</span> <span class="cm">/* 输入列表 */</span>
</span></span><span class="line"><span class="cl">    <span class="o">:</span><span class="s">&#34;%ecx&#34;</span><span class="p">,</span> <span class="s">&#34;%edi&#34;</span>                         <span class="cm">/* 修饰寄存器列表 */</span>
</span></span><span class="line"><span class="cl">    <span class="p">);</span>
</span></span></code></pre></td></tr></table>
</div>
</div><p>以上的内联汇编是将 <code>fill_value</code>  的值连续 <code>count</code> 次拷贝到寄存器 <code>edi</code> 所指位置
（每执行 <code>stosl</code> 一次，寄存器 <code>edi</code> 的值会递增或递减，这取决于是否设置了 <code>direction</code> 标志，因此以上代码实则初始化一个内存块）。
它也告诉 GCC 寄存器 <code>ecx</code> 和 <code>edi</code> 一直无效。</p>
<p>为了更加清晰地说明，让我们再看一个示例：</p>
<div class="highlight"><div class="chroma">
<table class="lntable"><tr><td class="lntd">
<pre tabindex="0" class="chroma"><code><span class="lnt">1
</span><span class="lnt">2
</span><span class="lnt">3
</span><span class="lnt">4
</span><span class="lnt">5
</span><span class="lnt">6
</span><span class="lnt">7
</span></code></pre></td>
<td class="lntd">
<pre tabindex="0" class="chroma"><code class="language-c" data-lang="c"><span class="line"><span class="cl"><span class="kt">int</span> <span class="n">a</span><span class="o">=</span><span class="mi">10</span><span class="p">,</span> <span class="n">b</span><span class="p">;</span>
</span></span><span class="line"><span class="cl"><span class="k">asm</span> <span class="p">(</span><span class="s">&#34;movl %1, %%eax;</span>
</span></span><span class="line"><span class="cl">      <span class="n">movl</span> <span class="o">%%</span><span class="n">eax</span><span class="p">,</span> <span class="o">%</span><span class="mi">0</span><span class="p">;</span><span class="s">&#34;</span>
</span></span><span class="line"><span class="cl">    <span class="o">:</span><span class="s">&#34;=r&#34;</span><span class="p">(</span><span class="n">b</span><span class="p">)</span>        <span class="cm">/* 输出列表 */</span>
</span></span><span class="line"><span class="cl">    <span class="o">:</span><span class="s">&#34;r&#34;</span><span class="p">(</span><span class="n">a</span><span class="p">)</span>         <span class="cm">/* 输入列表 */</span>
</span></span><span class="line"><span class="cl">    <span class="o">:</span><span class="s">&#34;%eax&#34;</span>         <span class="cm">/* 修饰寄存器列表 */</span>
</span></span><span class="line"><span class="cl">    <span class="p">);</span>
</span></span></code></pre></td></tr></table>
</div>
</div><p>这个示例的作用是使用汇编指令使变量 <code>b</code> 的值等于变量 <code>a</code> 的值。其中：</p>
<ul>
<li><code>b</code> 为输出操作数，用 <code>%0</code> 引用，<code>a</code> 为输入操作数，用 <code>%1</code> 引用。</li>
<li><code>&quot;r&quot;</code> 和 <code>&quot;=r&quot;</code> 为操作数约束字符串。之后会更详细地介绍约束。
这里 <code>r</code> 告诉 GCC 可以使用任一寄存器存储操作数。输出操作数约束应该有一个约束修饰符 <code>=</code>，表明它是一个只读的输出操作数。</li>
<li>寄存器名字以两个 <code>%</code> 为前缀。这有利于 GCC 区分操作数和寄存器。操作数以一个 <code>%</code> 为前缀。</li>
<li>第三个冒号之后的修饰寄存器 <code>%eax</code> 用于告诉 GCC <code>%eax</code> 的值将会在 <code>asm</code> 内部被修改，所以 GCC 将不会使用此寄存器存储任何其他值。</li>
</ul>
<p>以下是关于扩展汇编的更详细的介绍。</p>
<h3 id="43-汇编程序模板">4.3 汇编程序模板</h3>
<p>汇编程序模板包含了被插入到 C 语言程序的汇编指令集。
其格式为：每条指令用双引号圈起，或者整个指令组用双引号圈起。
同时每条指令应以分界符结尾。有效的分界符有换行符 <code>\n</code> 和分号 <code>;</code>，<code>\n</code> 可以紧随一个制表符 <code>\t</code>。</p>
<h3 id="44-输入操作数和输出操作数">4.4 输入操作数和输出操作数</h3>
<p>扩展汇编的每个操作数是一个用括弧圈起的 C 语言表达式，前面是以双引号圈起的操作数约束字符串。约束字符串主要用于决定操作数的寻址方式，同时也用于指定使用的寄存器。</p>
<p>当操作数多于一个时，用逗号隔开。</p>
<p>每个操作数在汇编程序模板中用数字引用。编号方式索引初始值为 <code>0</code>。操作数的最大个数在前一节介绍过。</p>
<p>输出操作数表达式必须为左值。输入操作数的要求不像这样严格。它们可以为表达式。
扩展汇编特性常常用于编译器所不知道的机器指令。如果输出表达式无法直接寻址（即它是一个位域），我们的约束字符串必须给定一个寄存器。
在这种情况下，GCC 将会使用该寄存器作为汇编的输出，然后存储该寄存器的内容到输出。</p>
<p>正如前面所陈述的一样，普通的输出操作数必须为只写的； GCC 将会假设指令前的操作数值是死的，并且不需要被（提前）生成。扩展汇编也支持输入-输出或者读-写操作数。</p>
<p>以下为另一个示例代码。目的是求一个数的5次方结果。为了计算该值，使用了 <code>lea</code> 指令。</p>
<div class="highlight"><div class="chroma">
<table class="lntable"><tr><td class="lntd">
<pre tabindex="0" class="chroma"><code><span class="lnt">1
</span><span class="lnt">2
</span><span class="lnt">3
</span><span class="lnt">4
</span></code></pre></td>
<td class="lntd">
<pre tabindex="0" class="chroma"><code class="language-c" data-lang="c"><span class="line"><span class="cl"><span class="k">asm</span> <span class="p">(</span><span class="s">&#34;leal (%1,%1,4), %0&#34;</span>
</span></span><span class="line"><span class="cl">    <span class="o">:</span><span class="s">&#34;=r&#34;</span><span class="p">(</span><span class="n">five_times_x</span><span class="p">)</span>
</span></span><span class="line"><span class="cl">    <span class="o">:</span><span class="s">&#34;r&#34;</span><span class="p">(</span><span class="n">x</span><span class="p">)</span>
</span></span><span class="line"><span class="cl">    <span class="p">);</span>
</span></span></code></pre></td></tr></table>
</div>
</div><p>这里输入为 <code>x</code>。不指定使用的寄存器，GCC 将会自己选择一些输入寄存器，一个输出寄存器。
如果想要输入和输出放在同一个寄存器里，可以通过指定合适的约束来实现它。示例代码：</p>
<div class="highlight"><div class="chroma">
<table class="lntable"><tr><td class="lntd">
<pre tabindex="0" class="chroma"><code><span class="lnt">1
</span><span class="lnt">2
</span><span class="lnt">3
</span><span class="lnt">4
</span></code></pre></td>
<td class="lntd">
<pre tabindex="0" class="chroma"><code class="language-c" data-lang="c"><span class="line"><span class="cl"><span class="k">asm</span> <span class="p">(</span><span class="s">&#34;leal (%0,%0,4), %0&#34;</span>
</span></span><span class="line"><span class="cl">    <span class="o">:</span><span class="s">&#34;=r&#34;</span><span class="p">(</span><span class="n">five_times_x</span><span class="p">)</span>
</span></span><span class="line"><span class="cl">    <span class="o">:</span><span class="s">&#34;0&#34;</span><span class="p">(</span><span class="n">x</span><span class="p">)</span>
</span></span><span class="line"><span class="cl">    <span class="p">);</span>
</span></span></code></pre></td></tr></table>
</div>
</div><p>现在输出和输出操作数位于同一个寄存器。但是无法得知是哪一个寄存器。
以下是另一种方法指定操作数所在的寄存器。示例代码：</p>
<div class="highlight"><div class="chroma">
<table class="lntable"><tr><td class="lntd">
<pre tabindex="0" class="chroma"><code><span class="lnt">1
</span><span class="lnt">2
</span><span class="lnt">3
</span><span class="lnt">4
</span></code></pre></td>
<td class="lntd">
<pre tabindex="0" class="chroma"><code class="language-c" data-lang="c"><span class="line"><span class="cl"><span class="k">asm</span> <span class="p">(</span><span class="s">&#34;leal (%%ecx,%%ecx,4), %%ecx&#34;</span>
</span></span><span class="line"><span class="cl">    <span class="o">:</span><span class="s">&#34;=c&#34;</span><span class="p">(</span><span class="n">x</span><span class="p">)</span>
</span></span><span class="line"><span class="cl">    <span class="o">:</span><span class="s">&#34;c&#34;</span><span class="p">(</span><span class="n">x</span><span class="p">)</span>
</span></span><span class="line"><span class="cl">    <span class="p">);</span>
</span></span></code></pre></td></tr></table>
</div>
</div><p>在以上三个示例中，我们并没有在修饰寄存器列表里添加任何寄存器，为什么？
在头两个示例， GCC 决定了寄存器并且它知道发生了什么改变。
在最后一个示例，我们不必将 <code>ecx</code> 添加到修饰寄存器列表。因为 GCC 已经知道它表示 <code>x</code>，它就不用被当作修饰的（寄存器）了。</p>
<h3 id="45-修饰寄存器列表">4.5 修饰寄存器列表</h3>
<p>一些指令会修改一些硬件寄存器内容。我们不得不在修饰寄存器列表中列出这些寄存器，即扩展汇编内第三个 <code>:</code> 之后的部分。
这可以告知 GCC 汇编指令将会使用和修改这些寄存器，这样 GCC 就不会假设存入这些寄存器的值是有效的。
不用在这个列表里列出输入、输出寄存器。因为它们被显式地指定了约束，GCC 可以推断 <code>asm</code> 使用了它们。
如果指令隐式或显式地使用了任何除此之外的其他寄存器，那么就需要在修饰寄存器列表中指定这些寄存器。</p>
<p>如果指令会修改 <strong><ruby>条件码寄存器<rt>Condition Code Register</rt></ruby></strong> （又称 <strong><ruby>状态寄存器<rt>Status Register</rt></ruby></strong> 或 <strong><ruby>标志寄存器<rt>Flag Register</rt></ruby></strong>），
则必须将 <code>%cc</code> 添加进修饰寄存器列表。</p>
<p>如果我们的指令以不可预测的方式修改了内存，那么需要将 <code>memory</code> 添加进修饰寄存器列表。
这可以使 GCC 不会在汇编指令间保持缓存于寄存器的内存值。如果被影响的内存不在汇编的输入或输出列表中，我们也必须添加 <code>volatile</code> 关键词。</p>
<p>我们可以按我们的需求多次读写修饰寄存器。参考一下模板内的多指令示例；它假设子例程 <code>_foo</code> 接受寄存器 <code>eax</code> 和 <code>ecx</code> 里的参数。</p>
<div class="highlight"><div class="chroma">
<table class="lntable"><tr><td class="lntd">
<pre tabindex="0" class="chroma"><code><span class="lnt">1
</span><span class="lnt">2
</span><span class="lnt">3
</span><span class="lnt">4
</span><span class="lnt">5
</span><span class="lnt">6
</span><span class="lnt">7
</span></code></pre></td>
<td class="lntd">
<pre tabindex="0" class="chroma"><code class="language-c" data-lang="c"><span class="line"><span class="cl"><span class="k">asm</span> <span class="p">(</span><span class="s">&#34;movl %0,%%eax;</span>
</span></span><span class="line"><span class="cl">      <span class="n">movl</span> <span class="o">%</span><span class="mi">1</span><span class="p">,</span><span class="o">%%</span><span class="n">ecx</span><span class="p">;</span>
</span></span><span class="line"><span class="cl">      <span class="n">call</span> <span class="n">_foo</span><span class="s">&#34;</span>
</span></span><span class="line"><span class="cl">    <span class="o">:</span> <span class="cm">/* no outputs */</span>
</span></span><span class="line"><span class="cl">    <span class="o">:</span><span class="s">&#34;g&#34;</span><span class="p">(</span><span class="n">from</span><span class="p">),</span> <span class="s">&#34;g&#34;</span><span class="p">(</span><span class="n">to</span><span class="p">)</span>
</span></span><span class="line"><span class="cl">    <span class="o">:</span><span class="s">&#34;eax&#34;</span><span class="p">,</span> <span class="s">&#34;ecx&#34;</span>
</span></span><span class="line"><span class="cl">    <span class="p">);</span>
</span></span></code></pre></td></tr></table>
</div>
</div><h3 id="46-关于-volatile">4.6 关于 <code>volatile</code></h3>
<p>如果汇编语句必须在我们放置它的地方执行（例如，不能为了优化而被移出循环语句），将 C 语言标准的关键词 <code>volatile</code> 放置在 <code>asm</code> 后面、<code>()</code> 的前面。
以避免编译器不可预知的优化，防止它被移动、删除或者其他操作。内核源码经常会有这种写法。</p>
<div class="highlight"><div class="chroma">
<table class="lntable"><tr><td class="lntd">
<pre tabindex="0" class="chroma"><code><span class="lnt">1
</span><span class="lnt">2
</span><span class="lnt">3
</span><span class="lnt">4
</span><span class="lnt">5
</span></code></pre></td>
<td class="lntd">
<pre tabindex="0" class="chroma"><code class="language-c" data-lang="c"><span class="line"><span class="cl"><span class="k">asm</span> <span class="nf">volatile</span> <span class="p">(</span> <span class="err">汇编程序模板</span>
</span></span><span class="line"><span class="cl">             <span class="o">:</span> <span class="err">输出操作数</span>     <span class="cm">/* 可选的 */</span>
</span></span><span class="line"><span class="cl">             <span class="o">:</span> <span class="err">输入操作数</span>     <span class="cm">/* 可选的 */</span>
</span></span><span class="line"><span class="cl">             <span class="o">:</span> <span class="err">修饰寄存器列表</span>  <span class="cm">/* 可选的 */</span>
</span></span><span class="line"><span class="cl">             <span class="p">);</span>
</span></span></code></pre></td></tr></table>
</div>
</div><p>类似于 <code>__asm__</code>，<code>__volatile__</code> 是 <code>volatile</code> 的别名，可以避免 <code>volatile</code> 与其它标识符冲突。</p>
<h3 id="47-关于操作数约束字符串">4.7 关于操作数约束字符串</h3>
<p>约束和内联汇编有很大的关联。但以上对约束的介绍还不多。约束用于表明</p>
<ul>
<li>操作数是否可以位于寄存器和位于哪种寄存器</li>
<li>操作数是否可以是一个内存引用和哪种地址</li>
<li>操作数是否可以是一个立即数和可能的取值范围，等等</li>
</ul>
<h4 id="471-常用约束">4.7.1 常用约束</h4>
<ol>
<li>
<p>寄存器操作数约束 <code>r</code></p>
<p>当使用这种约束指定操作数时，它们存储在 <strong><ruby>通用寄存器<rt>General Purpose Register</rt></ruby></strong> 中。示例代码：</p>
<div class="highlight"><div class="chroma">
<table class="lntable"><tr><td class="lntd">
<pre tabindex="0" class="chroma"><code><span class="lnt">1
</span></code></pre></td>
<td class="lntd">
<pre tabindex="0" class="chroma"><code class="language-c" data-lang="c"><span class="line"><span class="cl"><span class="k">asm</span> <span class="p">(</span><span class="s">&#34;movl %%eax, %0</span><span class="se">\n</span><span class="s">&#34;</span> <span class="o">:</span><span class="s">&#34;=r&#34;</span><span class="p">(</span><span class="n">myval</span><span class="p">));</span>
</span></span></code></pre></td></tr></table>
</div>
</div><p>变量 <code>myval</code> 保存在寄存器中，寄存器 <code>eax</code> 的值被复制到该寄存器中，然后 <code>myval</code> 的值从寄存器更新到了内存。</p>
<p>还可以指定其它特定的寄存器。它们为：</p>
<table>
<thead>
<tr>
<th style="text-align:left"><code>r</code></th>
<th style="text-align:left"><code>Register(s)</code></th>
</tr>
</thead>
<tbody>
<tr>
<td style="text-align:left"><code>a</code></td>
<td style="text-align:left"><code>%eax</code> <code>%ax</code> <code>%al</code></td>
</tr>
<tr>
<td style="text-align:left"><code>b</code></td>
<td style="text-align:left"><code>%ebx</code> <code>%bx</code> <code>%bl</code></td>
</tr>
<tr>
<td style="text-align:left"><code>c</code></td>
<td style="text-align:left"><code>%ecx</code> <code>%cx</code> <code>%cl</code></td>
</tr>
<tr>
<td style="text-align:left"><code>d</code></td>
<td style="text-align:left"><code>%edx</code> <code>%dx</code> <code>%dl</code></td>
</tr>
<tr>
<td style="text-align:left"><code>S</code></td>
<td style="text-align:left"><code>%esi</code> <code>%si</code></td>
</tr>
<tr>
<td style="text-align:left"><code>D</code></td>
<td style="text-align:left"><code>%edi</code> <code>%di</code></td>
</tr>
</tbody>
</table>
</li>
<li>
<p>内存操作数约束 <code>m</code></p>
<p><code>m</code> 约束允许一个内存操作数，可以使用机器普遍支持的任一种地址。
当操作数位于内存时，任何对它们的操作将直接发生在内存位置，这与寄存器约束相反，后者首先将值存储在要修改的寄存器中，然后将它写回到内存位置。
但寄存器约束通常用于一个指令必须使用它们或者它们可以大大提高处理速度的地方。
当需要在 <code>asm</code> 内直接更新一个 C 变量，而又不想使用寄存器去保存它的值，使用内存最为有效。例如，将 IDTR 寄存器的值存储于内存位置 loc 处：</p>
<div class="highlight"><div class="chroma">
<table class="lntable"><tr><td class="lntd">
<pre tabindex="0" class="chroma"><code><span class="lnt">1
</span></code></pre></td>
<td class="lntd">
<pre tabindex="0" class="chroma"><code class="language-c" data-lang="c"><span class="line"><span class="cl"><span class="k">asm</span> <span class="p">(</span><span class="s">&#34;sidt %0</span><span class="se">\n</span><span class="s">&#34;</span> <span class="o">:</span> <span class="o">:</span><span class="s">&#34;m&#34;</span><span class="p">(</span><span class="n">loc</span><span class="p">));</span>
</span></span></code></pre></td></tr></table>
</div>
</div></li>
<li>
<p>匹配（数字）约束</p>
<p>在某些情况下，一个变量可能既充当输入操作数，又充当输出操作数。可以通过使用匹配约束在 `asm 中指定这种情况。示例代码：</p>
<div class="highlight"><div class="chroma">
<table class="lntable"><tr><td class="lntd">
<pre tabindex="0" class="chroma"><code><span class="lnt">1
</span></code></pre></td>
<td class="lntd">
<pre tabindex="0" class="chroma"><code class="language-c" data-lang="c"><span class="line"><span class="cl"><span class="k">asm</span> <span class="p">(</span><span class="s">&#34;incl %0&#34;</span> <span class="o">:</span><span class="s">&#34;=a&#34;</span><span class="p">(</span><span class="n">var</span><span class="p">)</span><span class="o">:</span><span class="s">&#34;0&#34;</span><span class="p">(</span><span class="n">var</span><span class="p">));</span>
</span></span></code></pre></td></tr></table>
</div>
</div><p>这个匹配约束的示例中，寄存器 <code>%eax</code> 既用作输入变量，也用作输出变量。 <code>var</code> 输入被读进 <code>%eax</code>，并且等递增后更新的 <code>%eax</code> 再次被存储进 <code>var</code>。
这里的 <code>0</code> 用于指定与第 <code>0</code> 个输出变量相同的约束。该约束可用于：</p>
<ul>
<li>在输入从变量读取或变量修改后且修改被写回同一变量的情况</li>
<li>在不需要将输入操作数实例和输出操作数实例分开的情况</li>
</ul>
<p>使用匹配约束最重要的意义在于它们可以有效地使用可用寄存器。</p>
</li>
<li>
<p>一些其它通用约束</p>
<ul>
<li><code>o</code> 约束：允许一个内存操作数，但只有当地址是可偏移的时。即，该地址加上一个小的偏移量可以得到一个有效地址</li>
<li><code>V</code> 约束：一个不允许偏移的内存操作数。换言之，任何适合 &ldquo;m&rdquo; 约束而不适合 &ldquo;o&rdquo; 约束的操作数</li>
<li><code>i</code> 约束：允许一个（带有常量）的立即整形操作数，这包括其值仅在汇编时期知道的符号常量</li>
<li><code>n</code> 约束：允许一个带有已知数字的立即整形操作数。许多系统不支持汇编时期的常量，因为操作数少于一个字宽。对于此种操作数，约束应该使用 <code>n</code> 而不是 <code>i</code></li>
<li><code>g</code> 约束：允许任一寄存器、内存或者立即整形操作数，不包括通用寄存器之外的寄存器</li>
</ul>
</li>
<li>
<p>x86 架构特有的约束</p>
<ul>
<li><code>r</code> 约束：寄存器操作数约束，查看上面第 1 条</li>
<li><code>q</code> 约束：寄存器 <code>a</code>、<code>b</code>、<code>c</code> 或者 <code>d</code></li>
<li><code>I</code> 约束：范围从 <code>0</code> 到 <code>31</code> 的常量（对于 32 位移位）</li>
<li><code>J</code> 约束：范围从 <code>0</code> 到 <code>63</code> 的常量（对于 64 位移位）</li>
<li><code>K</code> 约束：<code>0xff</code></li>
<li><code>L</code> 约束：<code>0xffff</code></li>
<li><code>M</code> 约束：<code>0</code>、<code>1</code>、<code>2</code> 或 <code>3</code>（<code>lea</code> 指令的移位）</li>
<li><code>N</code> 约束：范围从 <code>0</code> 到 <code>255</code> 的常量（对于 <code>out</code> 指令）</li>
<li><code>f</code> 约束：浮点寄存器</li>
<li><code>t</code> 约束：第一个（栈顶）浮点寄存器</li>
<li><code>u</code> 约束：第二个浮点寄存器</li>
<li><code>A</code> 约束：指定 <code>a</code> 或 <code>d</code> 寄存器。这主要用于想要返回 64 位整形数，使用 <code>d</code> 寄存器保存最高有效位和 <code>a</code> 寄存器保存最低有效位</li>
</ul>
</li>
</ol>
<h4 id="472-约束修饰符">4.7.2 约束修饰符</h4>
<p>当使用约束时，对于更精确的控制超过了对约束作用的需求，GCC 给我们提供了约束修饰符。最常用的约束修饰符为：</p>
<ul>
<li><code>=</code> 约束修饰符：意味着对于这条指令，操作数为只写的，旧值会被忽略并被输出数据所替换</li>
<li><code>&amp;</code> 约束修饰符：意味着这个操作数为一个早期改动的操作数，其在该指令完成前通过使用输入操作数被修改了。
因此，这个操作数不可以位于一个被用作输出操作数或任何内存地址部分的寄存器。
如果在旧值被写入之前它仅用作输入而已，一个输入操作数可以为一个早期改动操作数。</li>
</ul>
<p>上述的约束列表和解释并不完整。下一节的示例可以让我们对内联汇编的用途和用法更好的理解。</p>
<h2 id="5-一些实用的示例">5. 一些实用的示例</h2>
<p>Linux 内核代码里看到许多内联汇编。将内联汇编函数写成宏的形式总是非常方便的。
（usr/src/linux/include/asm/*.h）</p>
<h3 id="51-两数相加">5.1 两数相加</h3>
<div class="highlight"><div class="chroma">
<table class="lntable"><tr><td class="lntd">
<pre tabindex="0" class="chroma"><code><span class="lnt"> 1
</span><span class="lnt"> 2
</span><span class="lnt"> 3
</span><span class="lnt"> 4
</span><span class="lnt"> 5
</span><span class="lnt"> 6
</span><span class="lnt"> 7
</span><span class="lnt"> 8
</span><span class="lnt"> 9
</span><span class="lnt">10
</span></code></pre></td>
<td class="lntd">
<pre tabindex="0" class="chroma"><code class="language-c" data-lang="c"><span class="line"><span class="cl"><span class="kt">int</span> <span class="nf">main</span><span class="p">(</span><span class="kt">void</span><span class="p">)</span>
</span></span><span class="line"><span class="cl"><span class="p">{</span>
</span></span><span class="line"><span class="cl">    <span class="kt">int</span> <span class="n">foo</span> <span class="o">=</span> <span class="mi">10</span><span class="p">,</span> <span class="n">bar</span> <span class="o">=</span> <span class="mi">15</span><span class="p">;</span>
</span></span><span class="line"><span class="cl">    <span class="n">__asm__</span> <span class="n">__volatile__</span><span class="p">(</span><span class="s">&#34;addl %%ebx,%%eax&#34;</span>
</span></span><span class="line"><span class="cl">                        <span class="o">:</span><span class="s">&#34;=a&#34;</span><span class="p">(</span><span class="n">foo</span><span class="p">)</span>
</span></span><span class="line"><span class="cl">                        <span class="o">:</span><span class="s">&#34;a&#34;</span><span class="p">(</span><span class="n">foo</span><span class="p">),</span> <span class="s">&#34;b&#34;</span><span class="p">(</span><span class="n">bar</span><span class="p">)</span>
</span></span><span class="line"><span class="cl">                        <span class="p">);</span>
</span></span><span class="line"><span class="cl">    <span class="n">printf</span><span class="p">(</span><span class="s">&#34;foo+bar=%d</span><span class="se">\n</span><span class="s">&#34;</span><span class="p">,</span> <span class="n">foo</span><span class="p">);</span>
</span></span><span class="line"><span class="cl">    <span class="k">return</span> <span class="mi">0</span><span class="p">;</span>
</span></span><span class="line"><span class="cl"><span class="p">}</span>
</span></span></code></pre></td></tr></table>
</div>
</div><p>这里将 <code>foo</code> 存放于 <code>%eax</code>，将 <code>bar</code> 存放于 <code>%ebx</code>，同时我们也想要在 <code>%eax</code> 中存放结果。
<code>=</code> 符号表示它是一个输出寄存器。还可以以其他方式将一个整数加到一个变量。示例代码：</p>
<div class="highlight"><div class="chroma">
<table class="lntable"><tr><td class="lntd">
<pre tabindex="0" class="chroma"><code><span class="lnt">1
</span><span class="lnt">2
</span><span class="lnt">3
</span><span class="lnt">4
</span><span class="lnt">5
</span><span class="lnt">6
</span></code></pre></td>
<td class="lntd">
<pre tabindex="0" class="chroma"><code class="language-c" data-lang="c"><span class="line"><span class="cl"><span class="n">__asm__</span> <span class="n">__volatile__</span><span class="p">(</span><span class="s">&#34;lock       ;</span><span class="se">\n</span><span class="s">&#34;</span>
</span></span><span class="line"><span class="cl">                     <span class="s">&#34;addl %1,%0 ;</span><span class="se">\n</span><span class="s">&#34;</span>
</span></span><span class="line"><span class="cl">                    <span class="o">:</span><span class="s">&#34;=m&#34;</span><span class="p">(</span><span class="n">my_var</span><span class="p">)</span>
</span></span><span class="line"><span class="cl">                    <span class="o">:</span><span class="s">&#34;ir&#34;</span><span class="p">(</span><span class="n">my_int</span><span class="p">),</span> <span class="s">&#34;m&#34;</span><span class="p">(</span><span class="n">my_var</span><span class="p">)</span>
</span></span><span class="line"><span class="cl">                    <span class="o">:</span> <span class="cm">/* 无修饰寄存器列表 */</span>
</span></span><span class="line"><span class="cl">                    <span class="p">);</span>
</span></span></code></pre></td></tr></table>
</div>
</div><p>这是一个原子加法。为了移除原子性，可以移除指令 <code>lock</code>。在输出域中，<code>=m</code> 表明 <code>myvar</code> 是一个输出且位于内存。
类似地，<code>ir</code> 表明 <code>myint</code> 是一个整型，并应该存在于其他寄存器。没有寄存器位于修饰寄存器列表中。</p>
<h3 id="52-比较值">5.2 比较值</h3>
<div class="highlight"><div class="chroma">
<table class="lntable"><tr><td class="lntd">
<pre tabindex="0" class="chroma"><code><span class="lnt">1
</span><span class="lnt">2
</span><span class="lnt">3
</span><span class="lnt">4
</span><span class="lnt">5
</span></code></pre></td>
<td class="lntd">
<pre tabindex="0" class="chroma"><code class="language-C" data-lang="C"><span class="line"><span class="cl"><span class="n">__asm__</span> <span class="n">__volatile__</span><span class="p">(</span><span class="s">&#34;decl %0; sete %1&#34;</span>
</span></span><span class="line"><span class="cl">                    <span class="o">:</span><span class="s">&#34;=m&#34;</span><span class="p">(</span><span class="n">my_var</span><span class="p">),</span> <span class="s">&#34;=q&#34;</span><span class="p">(</span><span class="n">cond</span><span class="p">)</span>
</span></span><span class="line"><span class="cl">                    <span class="o">:</span><span class="s">&#34;m&#34;</span><span class="p">(</span><span class="n">my_var</span><span class="p">)</span>
</span></span><span class="line"><span class="cl">                    <span class="o">:</span><span class="s">&#34;memory&#34;</span>
</span></span><span class="line"><span class="cl">                    <span class="p">);</span>
</span></span></code></pre></td></tr></table>
</div>
</div><p>这里将 <code>my_var</code> 的值减 <code>1</code>，并且如果结果的值为 <code>0</code>，则变量 <code>cond</code> 置 <code>1</code>。
可以通过将指令 <code>lock;\n\t</code> 添加为汇编模板的第一条指令以增加原子性。</p>
<p>类似的方式，为了增加 <code>my_var</code> 的值，我们可以使用 <code>incl %0</code> 代替 <code>decl %0</code>。</p>
<p>这里需要注意的地方是</p>
<ul>
<li><code>my_var</code> 是一个存储于内存的变量</li>
<li><code>cond</code> 位于寄存器 <code>eax</code>、<code>ebx</code>、<code>ecx</code>、<code>edx</code> 中的任何一个，约束 <code>=q</code> 保证了这一点</li>
<li><code>memory</code> 位于修饰寄存器列表中，也就是说，代码将改变内存中的内容</li>
</ul>
<h3 id="53-将寄存器中的一个比特位置-1-或清-0">5.3 将寄存器中的一个比特位置 <code>1</code> 或清 <code>0</code></h3>
<div class="highlight"><div class="chroma">
<table class="lntable"><tr><td class="lntd">
<pre tabindex="0" class="chroma"><code><span class="lnt">1
</span><span class="lnt">2
</span><span class="lnt">3
</span><span class="lnt">4
</span><span class="lnt">5
</span></code></pre></td>
<td class="lntd">
<pre tabindex="0" class="chroma"><code class="language-c" data-lang="c"><span class="line"><span class="cl"><span class="n">__asm__</span> <span class="nf">__volatile__</span><span class="p">(</span><span class="s">&#34;btsl %1,%0&#34;</span>
</span></span><span class="line"><span class="cl">                    <span class="o">:</span><span class="s">&#34;=m&#34;</span><span class="p">(</span><span class="n">ADDR</span><span class="p">)</span>
</span></span><span class="line"><span class="cl">                    <span class="o">:</span><span class="s">&#34;Ir&#34;</span><span class="p">(</span><span class="n">pos</span><span class="p">)</span>
</span></span><span class="line"><span class="cl">                    <span class="o">:</span><span class="s">&#34;cc&#34;</span>
</span></span><span class="line"><span class="cl">                    <span class="p">);</span>
</span></span></code></pre></td></tr></table>
</div>
</div><p>这里 <code>ADDR</code> 变量（一个内存变量）的 <code>pos</code> 位置上的比特被设置为 <code>1</code>。可以使用 <code>btrl</code> 来清除由 <code>btsl</code> 设置的比特位。
<code>pos</code> 的约束 <code>Ir</code> 表明 <code>pos</code> 位于寄存器，并且它的值为 0-31（x86 相关约束）。
也就是说，可以设置/清除 <code>ADDR</code> 变量上第 0 到 31 位的任一比特位。因为条件码会被改变，所以我们将 <code>cc</code> 添加进修饰寄存器列表。</p>
<h3 id="54-字符串拷贝">5.4 字符串拷贝</h3>
<div class="highlight"><div class="chroma">
<table class="lntable"><tr><td class="lntd">
<pre tabindex="0" class="chroma"><code><span class="lnt"> 1
</span><span class="lnt"> 2
</span><span class="lnt"> 3
</span><span class="lnt"> 4
</span><span class="lnt"> 5
</span><span class="lnt"> 6
</span><span class="lnt"> 7
</span><span class="lnt"> 8
</span><span class="lnt"> 9
</span><span class="lnt">10
</span><span class="lnt">11
</span><span class="lnt">12
</span></code></pre></td>
<td class="lntd">
<pre tabindex="0" class="chroma"><code class="language-c" data-lang="c"><span class="line"><span class="cl"><span class="k">static</span> <span class="kr">inline</span> <span class="kt">char</span> <span class="o">*</span> <span class="nf">strcpy</span><span class="p">(</span><span class="kt">char</span> <span class="o">*</span> <span class="n">dest</span><span class="p">,</span><span class="k">const</span> <span class="kt">char</span> <span class="o">*</span><span class="n">src</span><span class="p">)</span>
</span></span><span class="line"><span class="cl"><span class="p">{</span>
</span></span><span class="line"><span class="cl">    <span class="kt">int</span> <span class="n">d0</span><span class="p">,</span> <span class="n">d1</span><span class="p">,</span> <span class="n">d2</span><span class="p">;</span>
</span></span><span class="line"><span class="cl">    <span class="n">__asm__</span> <span class="n">__volatile__</span><span class="p">(</span><span class="s">&#34;1:</span><span class="se">\t</span><span class="s">lodsb</span><span class="se">\n\t</span><span class="s">&#34;</span>
</span></span><span class="line"><span class="cl">                         <span class="s">&#34;stosb</span><span class="se">\n\t</span><span class="s">&#34;</span>
</span></span><span class="line"><span class="cl">                         <span class="s">&#34;testb %%al,%%al</span><span class="se">\n\t</span><span class="s">&#34;</span>
</span></span><span class="line"><span class="cl">                         <span class="s">&#34;jne 1b&#34;</span>
</span></span><span class="line"><span class="cl">                        <span class="o">:</span><span class="s">&#34;=&amp;S&#34;</span><span class="p">(</span><span class="n">d0</span><span class="p">),</span> <span class="s">&#34;=&amp;D&#34;</span><span class="p">(</span><span class="n">d1</span><span class="p">),</span> <span class="s">&#34;=&amp;a&#34;</span><span class="p">(</span><span class="n">d2</span><span class="p">)</span>
</span></span><span class="line"><span class="cl">                        <span class="o">:</span><span class="s">&#34;0&#34;</span><span class="p">(</span><span class="n">src</span><span class="p">),</span> <span class="s">&#34;1&#34;</span><span class="p">(</span><span class="n">dest</span><span class="p">)</span>
</span></span><span class="line"><span class="cl">                        <span class="o">:</span><span class="s">&#34;memory&#34;</span><span class="p">);</span>
</span></span><span class="line"><span class="cl">    <span class="k">return</span> <span class="n">dest</span><span class="p">;</span>
</span></span><span class="line"><span class="cl"><span class="p">}</span>
</span></span></code></pre></td></tr></table>
</div>
</div><p>源地址存放于 <code>esi</code>，目标地址存放于 <code>edi</code>，同时开始拷贝，当我们到达 <code>0</code> 时，拷贝完成。
约束 <code>&amp;S</code>、<code>&amp;D</code>、<code>&amp;a</code> 表明寄存器 <code>esi</code>、<code>edi</code> 和 <code>eax</code> 早期修饰寄存器。
也就是说，它们的内容在函数完成前会被改变。这里很明显可以知道为什么 <code>memory</code> 会放在修饰寄存器列表。</p>
<p>以下还有一个类似的函数，能移动双字块数据。函数被声明为一个宏：</p>
<div class="highlight"><div class="chroma">
<table class="lntable"><tr><td class="lntd">
<pre tabindex="0" class="chroma"><code><span class="lnt">1
</span><span class="lnt">2
</span><span class="lnt">3
</span><span class="lnt">4
</span><span class="lnt">5
</span><span class="lnt">6
</span><span class="lnt">7
</span><span class="lnt">8
</span></code></pre></td>
<td class="lntd">
<pre tabindex="0" class="chroma"><code class="language-C" data-lang="C"><span class="line"><span class="cl"><span class="cp">#define mov_blk(src, dest, numwords)                     \
</span></span></span><span class="line"><span class="cl"><span class="cp">__asm__ __volatile__ (&#34;cld\n\t&#34;                          \
</span></span></span><span class="line"><span class="cl"><span class="cp">                      &#34;rep\n\t&#34;                          \
</span></span></span><span class="line"><span class="cl"><span class="cp">                      &#34;movsl&#34;                            \
</span></span></span><span class="line"><span class="cl"><span class="cp">                     :                                   \
</span></span></span><span class="line"><span class="cl"><span class="cp">                     :&#34;S&#34;(src), &#34;D&#34;(dest), &#34;c&#34;(numwords) \
</span></span></span><span class="line"><span class="cl"><span class="cp">                     :&#34;%ecx&#34;, &#34;%esi&#34;, &#34;%edi&#34;             \
</span></span></span><span class="line"><span class="cl"><span class="cp">                     )
</span></span></span></code></pre></td></tr></table>
</div>
</div><p>这里没有输出，寄存器 <code>ecx</code>、<code>esi</code> 和 <code>edi</code> 的内容发生了改变，这是块移动的副作用。因此必须将它们添加进修饰寄存器列表。</p>
<h3 id="55-linux-中的系统调用">5.5 Linux 中的系统调用</h3>
<p>Linux 中的所有的系统调用都被写成宏（linux/unistd.h）。例如，带有三个参数的系统调用被定义为如下所示的宏。</p>
<div class="highlight"><div class="chroma">
<table class="lntable"><tr><td class="lntd">
<pre tabindex="0" class="chroma"><code><span class="lnt">1
</span><span class="lnt">2
</span><span class="lnt">3
</span><span class="lnt">4
</span><span class="lnt">5
</span><span class="lnt">6
</span><span class="lnt">7
</span><span class="lnt">8
</span><span class="lnt">9
</span></code></pre></td>
<td class="lntd">
<pre tabindex="0" class="chroma"><code class="language-C" data-lang="C"><span class="line"><span class="cl"><span class="n">type</span> <span class="nf">name</span><span class="p">(</span><span class="n">type1</span> <span class="n">arg1</span><span class="p">,</span><span class="n">type2</span> <span class="n">arg2</span><span class="p">,</span><span class="n">type3</span> <span class="n">arg3</span><span class="p">)</span>                                   \
</span></span><span class="line"><span class="cl"><span class="p">{</span>                                                                             \
</span></span><span class="line"><span class="cl">    <span class="kt">long</span> <span class="n">__res</span><span class="p">;</span>                                                               \
</span></span><span class="line"><span class="cl">    <span class="n">__asm__</span> <span class="k">volatile</span> <span class="p">(</span><span class="s">&#34;int $0x80&#34;</span>                                             \
</span></span><span class="line"><span class="cl">                     <span class="o">:</span><span class="s">&#34;=a&#34;</span><span class="p">(</span><span class="n">__res</span><span class="p">)</span>                                             \
</span></span><span class="line"><span class="cl">                     <span class="o">:</span><span class="s">&#34;0&#34;</span><span class="p">(</span><span class="n">__NR_</span><span class="err">##</span><span class="n">name</span><span class="p">),</span> <span class="s">&#34;b&#34;</span><span class="p">((</span><span class="kt">long</span><span class="p">)(</span><span class="n">arg1</span><span class="p">)),</span> <span class="s">&#34;c&#34;</span><span class="p">((</span><span class="kt">long</span><span class="p">)(</span><span class="n">arg2</span><span class="p">)),</span> \
</span></span><span class="line"><span class="cl">                      <span class="s">&#34;d&#34;</span><span class="p">((</span><span class="kt">long</span><span class="p">)(</span><span class="n">arg3</span><span class="p">)));</span>                                     \
</span></span><span class="line"><span class="cl">    <span class="n">__syscall_return</span><span class="p">(</span><span class="n">type</span><span class="p">,</span> <span class="n">__res</span><span class="p">);</span>                                            \
</span></span><span class="line"><span class="cl"><span class="p">}</span>
</span></span></code></pre></td></tr></table>
</div>
</div><p>无论何时调用带有三个参数的系统调用，以上展示的宏就会用于执行调用。
系统调用号位于 <code>eax</code> 中，每个参数位于 <code>ebx</code>、<code>ecx</code>、<code>edx</code> 中。最后 <code>int 0x80</code> 是一条用于执行系统调用的指令。返回值被存储于 <code>eax</code> 中。</p>
<p>每个系统调用都以类似的方式实现。<code>Exit</code> 是一个单一参数的系统调用。它的实现如下所示：</p>
<div class="highlight"><div class="chroma">
<table class="lntable"><tr><td class="lntd">
<pre tabindex="0" class="chroma"><code><span class="lnt">1
</span><span class="lnt">2
</span><span class="lnt">3
</span><span class="lnt">4
</span><span class="lnt">5
</span><span class="lnt">6
</span></code></pre></td>
<td class="lntd">
<pre tabindex="0" class="chroma"><code class="language-C" data-lang="C"><span class="line"><span class="cl"><span class="p">{</span>
</span></span><span class="line"><span class="cl">    <span class="k">asm</span><span class="p">(</span><span class="s">&#34;movl $1,%%eax;    /* SYS_exit is 1 */</span>
</span></span><span class="line"><span class="cl">         <span class="n">xorl</span> <span class="o">%%</span><span class="n">ebx</span><span class="p">,</span><span class="o">%%</span><span class="n">ebx</span><span class="p">;</span> <span class="cm">/* Argument is in ebx, it is 0 */</span>
</span></span><span class="line"><span class="cl">         <span class="kt">int</span>  <span class="err">$</span><span class="mh">0x80</span><span class="s">&#34;       /* Enter kernel mode */</span>
</span></span><span class="line"><span class="cl">        <span class="p">);</span>
</span></span><span class="line"><span class="cl"><span class="p">}</span>
</span></span></code></pre></td></tr></table>
</div>
</div><p><code>Exit</code> 的系统调用号是 <code>1</code>，同时它的参数是 <code>0</code>。因此我们分配 <code>eax</code> 包含 <code>1</code>，<code>ebx</code> 包含 <code>0</code>，同时通过 <code>int $0x80</code> 执行 <code>exit(0)</code>。</p>
<h2 id="6-其它">6. 其它</h2>
<p>C 语言内联汇编是一个极大的主题，本文的介绍是不完整的。
GCC 和 Clang 的官方文档均详细介绍了其所支持的内联汇编语法，关于以上讨论过的语法细节可以在它们的文档上获取。</p>
<p>Linux 内核大量地使用了 GCC 内联汇编，强烈推荐在 <a href="https://elixir.bootlin.com/linux/latest/source" target="_blank" rel="noopener noreffer ">Bootlin</a> 上阅读 Linux 源码。</p>
<div class="footnotes" role="doc-endnotes">
<hr>
<ol>
<li id="fn:1">
<p><a href="https://zh.cppreference.com/w/c" target="_blank" rel="noopener noreffer ">C 参考手册</a>&#160;<a href="#fnref:1" class="footnote-backref" role="doc-backlink">&#x21a9;&#xfe0e;</a></p>
</li>
<li id="fn:2">
<p><a href="https://gcc.gnu.org/onlinedocs/" target="_blank" rel="noopener noreffer ">GCC online documentation</a>&#160;<a href="#fnref:2" class="footnote-backref" role="doc-backlink">&#x21a9;&#xfe0e;</a></p>
</li>
<li id="fn:3">
<p><a href="https://clang.llvm.org/docs/UsersManual.html" target="_blank" rel="noopener noreffer ">Clang Compiler User’s Manual</a>&#160;<a href="#fnref:3" class="footnote-backref" role="doc-backlink">&#x21a9;&#xfe0e;</a></p>
</li>
<li id="fn:4">
<p><a href="https://www.ibm.com/developerworks/cn/aix/library/au-inline_assembly/index.html" target="_blank" rel="noopener noreffer ">内联汇编 - 从头开始</a>&#160;<a href="#fnref:4" class="footnote-backref" role="doc-backlink">&#x21a9;&#xfe0e;</a></p>
</li>
</ol>
</div>]]></description></item><item><title>这是个开始</title><link>https://dillonzq.com/2019/08/%E8%BF%99%E6%98%AF%E4%B8%AA%E5%BC%80%E5%A7%8B/</link><pubDate>Sun, 04 Aug 2019 22:49:56 +0800</pubDate><author>Dillon</author><guid>https://dillonzq.com/2019/08/%E8%BF%99%E6%98%AF%E4%B8%AA%E5%BC%80%E5%A7%8B/</guid><description><![CDATA[<h2 id="为什么建站">为什么建站</h2>
<p>人最重要的特点是会思考，写博客的初衷是保存思维的电子快照。
当然各种文档工具亦或是简单的文本编辑器也能随时记录点滴，
选择建个人网站无非是想满足技术爱好者的偏执。</p>
<p>但仔细想来，发表到网站上的每篇文章又不同于随手记下的思维碎片，它必是经过整理和总结过的，
具有一定的可读性，甚至有于己或于人的实用价值。</p>
<p>网站同时开启了基于 <a href="https://valine.js.org/" target="_blank" rel="noopener noreffer ">Valine</a> 的讨论功能，欢迎思维的碰撞，不欢迎恶语或诽谤。</p>
<h2 id="为什么选择-hugohttpsgohugoio">为什么选择 <a href="https://gohugo.io/" target="_blank" rel="noopener noreffer ">Hugo</a></h2>
<p>大一开始了解建站技术，从 <a href="https://wordpress.org/" target="_blank" rel="noopener noreffer ">WordPress</a> 到 <a href="https://zh.wikipedia.org/wiki/LAMP" target="_blank" rel="noopener noreffer ">LAMP</a> 都学习过，
不喜欢其复杂性和不自由 <del>，可能仅仅是因为懒惰🤪</del>。另外，本人对于自由软件精神的了解大致源于此。</p>
<p>出于对 <a href="https://golang.org" target="_blank" rel="noopener noreffer ">Go</a> 的好感，我毫不犹豫地放弃了 <a href="https://hexo.io" target="_blank" rel="noopener noreffer ">Hexo</a> 和 <a href="https://jekyllrb.com/" target="_blank" rel="noopener noreffer ">Jekyll</a> ，投入 Hugo 的怀抱。
当然 Hugo 也没有辜负我的期待。Go 给了 Hugo 最快的静态网站生成速度。
详细的文档（官方中文还在翻译中，目前有贡献翻译的想法）、丰富和高度可定制化的主题都让我惊喜。</p>
<p>于是，经过一周的 <a href="https://gohugo.io/documentation/" target="_blank" rel="noopener noreffer ">Hugo 文档</a> 学习之后，
我基于 <a href="https://github.com/Fastbyte01/KeepIt" target="_blank" rel="noopener noreffer ">KeepIt</a> 深度定制了主题 <a href="https://github.com/dillonzq/LoveIt" target="_blank" rel="noopener noreffer ">LoveIt</a>，网站就上线了。</p>
<h2 id="这只是个开始">这只是个开始</h2>
<p>本文是网站的第一篇文章，标题为 <strong>这是个开始</strong>，其实，这只是个开始。</p>
<p>网站的副标题为，</p>
<blockquote>
<p>不知道自己无知，乃是双倍的无知。</p>
</blockquote>
<p>柏拉图如是说。</p>
<p>建站的初衷不是为了炫耀所知，而是记录无知。</p>
<p>人知道得越多，就会发现无知的越多。有更广袤的世界可以探索，是莫大的快乐呀！</p>]]></description></item></channel></rss>