[Lua]关于lua元表(Metatable)

前言

在lua中最重要的一个数据结构就是table,而table有一个重要的功能就是设置元表(Metatable)在元表中设置元方法,就能帮我们实现面向对象的一些功能。

基础概念

lua中每个值都可以有一个元表,这个元表就是一个普通的table,它用于定义原始值在特定操作下的行为。如果你想改变一个值在特定操作下的行为,你可以在它的元表中设置对应域。
在元表的事件的键值是一个双下划线(__)加事件名的字符串;键关联的那些值被称为元方法。
可以用getmetatable函数来获取任何值的元表。lua使用直接访问的方式从元表中查询元方法。
可以使用setmetatable来替换一张表的元表,在lua中,你不可以改变表以外其他类型的值的元表;如果想改变这些非表类型的值的元表,需要是用c语言接口。
table和userdata有独立的元表,其他类型的值按类型共享元表;也就是说所有的数字都共享同一个元素,所有的字符串共享另一个元表等等。在默认情况下,值是没有元表的,但是字符串库在初始化的时候为字符串类型设置了元表。
元表决定了一个对象在数学运算,位运算,比较,连接,取长度,调用,索引时的行为。元表还可以定义一个函数,当table或者userdata被回收的时候调用它。

事件

  • add:+操作。如果任何不适数字的值做加法,lua都会尝试调用元方法。首先,lua检查第一个操作数,如果这个操作数没有为“add”事件的元方法,lua就会检查第二个操作数,一旦lua找到了元方法,它就将这两个操作数作为参数传入元方法里然后返回一个操作结果。如果找不到元方法,将抛出一个错误
local table1 = {
    [1] = 10
}
local table2 = {
    [1] = 20
}
--[
    a为+左边的,b为右边的值
--]
local mt = {
    __add = function(a,b)
        print(a[1],b[1])
    end
}
setmetatable(table2,mt)
local table3 = table1 + table2
  • __sub:-操作符。行为和“add”操作类型。

  • __mul:*操作符。行为和“add”操作类似。

  • __div:/操作符。行为和“add”操作类似。

  • __mod:%操作符。行为同上。

  • __pow:^(次方)操作符,行为同上

  • __unm:-(取反)操作,行为同上

  • __idiv://(向下取整除法)。行为同上

  • __band:&(按位与)操作。行为同上。lua会在任何一个操作数无法转换为整数时尝试取元方法

  • __bor:|(按位或)操作,行为同上。

  • __bxor:~(按位异或)操作,行为同上。

  • __bnot:~(按位非)操作,行为同上。

  • __shl:<<(左移)操作,行为同上。

  • __shr:>>(右移)操作,行为同上。

  • __concat:..(连接)操作,行为和“add”操作类似,不同的是lua在任何操作数即不是一个字符串,也不是一个数字的情况下尝试元方法。

  • __len:#(取长度)操作,如果对象不是字符串,lua会尝试它的元方法。如果有元方法,则调用它并将对象以参数形式传入,而返回值则作为结果。如果对象是一张表且没有元方法,lua使用表的取长度操作。其他情况均抛出异常

  • __eq:==(等于)操作。和“add”行为类似,不同的是lua仅在两个值都是表或都是userdata且他们不是同一个对象的时候才尝试元方法。返回结果转换为bool。

  • __lt:<(小于)操作。和“add”操作行为类似,不同的是lua仅在两个值不全为整数也不全为字符串时才尝试元方法。返回结果为bool。

  • le:<=(小于等于)操作。和其他操作不同,小于等于操作可能用到两个不同的事件。首先回去找两个操作数中的"le"元方法,如果都没有,那就会再次查找"__lt"。返回bool

  • __index:索引table[key]。当table不是表或者是表中不存在key这个键时,这个时间会被触发。这个事件的元方法可以是一张表,也可以是一个函数,如果是一个函数的话则以table和key作为参数调用它。如果是一个表,那就是在这个表里去key这个索引的值。

  • newindex:索引赋值table[key] = value.和索引事件类似,它发生在table不是表或是表table中不存在key这个键的时候调用对应的元方法
    这个方法可以是一个表也可以是一个函数,如果是函数的话则是以table,key和value作为参数传入。如果是一张表,则对这个表做索引赋值操作。一旦有了“
    newindex”元方法,lua就不再做最初的赋值操作。

  • __call:函数调用操作func(args)。当lua尝试调用一个非函数的值的时候会触发这个事件。查找func的元方法,如果找的到,func作为第一个参数传入,原来调用的参数(args)后依次排在后面。

方法

getmetatable(object)

这个方法是用来获取一个值的元表。否则,如果在该对象的元表中有“__metatable”域时返回其关联值,没有时返回该对象的元素。

setmetatable(table,metatable)

这个方法是用来设置一个值的元表。(不能在lua中改变其它类型的元表,只能在c中做),如果metatable是nil,则将table中的元表移除。如果元表有“__metatable”域,抛出一个错误。

rawequal(v1,v2)

在不触发任何元方法的情况下检查v1是否和v2相等,返回一个bool值

rawget(table,index)

在不触发任何元方法的情况下获取table[index]的值,table必须是一张表,index可以是任何值

rawlen(v)

在不触发任何元方法的情况下返回对象v的长度。v可以是表或字符串。它返回一个整数。

rawset(table,index,value)

在不触发任何元方法的情况下将table[index]设置为value.table必须是一张表,index可以使是nil与NaN之外的任何值。value可以是任何lua值。

实战

不能修改tale中的值

local list = {
    ["a"] = "a",
    ["b"] = "b"
}
local mt = {
    __index = list,
    __newindex = function (table,key,value)
        if list[key] then
            print("不能修改")
        end
        end,
}
local list2 = {}
local list1 = setmetatable(list2,mt)
list1["a"] = "c"

把list作为元表赋值给list1,当我要给list1赋值的时候,list1中表是空的,所以会去找元方法中的newindex,newindex函数的参数table代表着list2,key代表着“a”,value代表着“c”,做判断的时候,我们直接函数里面不处理,就不会添加到我们不想修改的list中的值了。

重点

有的时候,我们不想在lua中被设置了一个全局变量。因为lua其实也相当于一个表,它的全局变量存在_G中,首先我们可以先获取_G,然后给_G设置一个不能添加修改值的这个方法。

[算法]快排

原理

中心思想是用了二分法,首先取一个标致值,用这个标致值来分割两部分,一部分比它大,一部分比它小,然后就这样递归下去,直到全部的值都已经变成有序的。

上图


用图的方式更方便理解这个概念。

代码详情

第一种

 void Quicksort(int[]numbers,int left,int right)
            {
                if (left < right)
                {
                    int middle = numbers[(left + right) / 2];
                    int i = left -1 ;
                    int j = right + 1;
                    while (true)
                    {
                        while (numbers[++i] < middle) ;
                        while (numbers[--j] > middle) ;
                        if (i >= j)
                            break;
                        swap(numbers, i, j);
                    }
                    Quicksort(numbers, left, i - 1);
                    Quicksort(numbers, j+1, right);
                }
            }
void swap (int[]numbers,int i,int j)
            {
                int number = numbers[i];
                numbers[i] = numbers[j];
                numbers[j] = number;
            }

代码解释

首先我们找到一个标识值middle这个值是我们要分隔数组的中间值,然后我们定义两个下标,分别代表,比middle大的值,和比middle小的值,分别用i,j来表示,然后我们在while循环中,首先找到比middlle大的i下标的值,和比middle小的j下标的值,来调换位置,当找到i已经比j大等的时候,说明我们这次已经找完了,已经查到了middle这个值的下标,然后我们就开始分左右两个部分继续来大小划分。这时候的开始左边的区间就左边是这次的左区间加上这次找到的标识左边下标,右边区间就是标识右边的值加上当前区间的右边下标。

第二种

void Quicksort1(int [] numbers,int left,int right)
            {
                int i, last;
                if (left >= right)
                    return;
                swap(numbers, left, (left + right) / 2);
                last = left;
                for(i = left + 1; i < right; i++)
                {
                    if (numbers[i] < numbers[left])
                    {
                        swap(numbers, ++last, i);
                    }
                }
                swap(numbers, left, last);
                Quicksort1(numbers, left, last);
                Quicksort1(numbers, last+1, right);
            }
 void swap (int[]numbers,int i,int j)
            {
                int number = numbers[i];
                numbers[i] = numbers[j];
                numbers[j] = number;
            }

代码解释

首先我们把最左边的值和中间的值交换,然后我们记录下来交换的值的位置设置为last,因为我们已经把中间值和最左边的值交换了,所以我们标志值在最左边,我们就用这个值来和当前数组中的所有值来进行比较,如果比较的值比标识值小的话,就累加last然后交换,就把这个值换到了左边去了,如果大的话就不动,所以换过的左边都是比标识小的,最后当前的标识符换到最后一个最小的值的位置,那个位置之后就没有比标识值更小的了。然后再递归分割。

[Unity3D]Unity中影响渲染顺序的因素总结

一,Camera Depth

相机组件上设置的相机深度,深度越大越靠后渲染。

二,透明,不透明物体分隔

RenderQueue 2500是透明与不透明的分水岭。
同一个相机下
Renderqueue小于2500的物体始终在Renderqueue大于2500之前绘制。

三,Sorting Layer

在Tags&Layers设置中可见
如果Camera相同,那接下来就看Sorting Layers,越低越早绘制。
Sorting Layers是通过Renderer的SortingLayerName属性设置的。
全局的Soring Layers在Edit->ProjectSettings->Tags&Layers中设置可以通过代码设置render.sortingLayerName="Name"运行时设置物体的sortinglayer,如果在粒子系统中看,可以看到Render项的Sorting Layers下拉表单中会列出所有的Sorting Layers的名字。

四,Order In Layer

相对于Sorting Layer的子排序,用这个值做比较时只有Sorting Layer在同一层的时候才有效。
order是设置一个数字,数字越大,越显示在最上面。

五,RenderQueue

shader中对Tags设置的“Queue”。
如果上面几项都相同的情况下,就要设置RenderQueue了,renderQueue是Material的一个属性,其实就是shader中的renderQueue,这个值是一个int属性,数值越小,越靠近前面渲染。

六,深度排序。按照包围盒的深度进行排序

不透明物体由近到远排序优先
透明物体由远到进排序优先
按照包围盒的中心点的深度进行排序。

深度补间

ZBias,当两个包围盒中心点深度值相同或者很近的物体在一起时,排序有可能出错所以对于这个点的z值可以进行微调。

上图

[unity源码]AxisEventData

这个类是继承于BaseEventData是用于和轴相关的事件数据(控制器/键盘)

属性

  1. public Vector2 moveVector {get;set;}于此事件关联的原始输入向量

  2. public MoveDirection moveDir{get;set;} 此事件的MoveDirection类型一种表示左右上下none状态的一个枚举

方法

  1. public AxisEventData(EventSystem eventSystem):base(eventSystem) 一个带eventsystem的构造函数,初始化moveVector和moveDir属性的值,把参数传给基类BaseEventData

[Unity3D]编辑器类MenuItem方法浅析

前言

在使用Editor类型的时候,我们需要显示一个入口函数,一般来说,我们都是用MenuItem这个类来构造一个入口函数。

知识点

  1. itemName(string)
    这是用来显示我们在编辑器上所看到的item的名字,也可以认为是一个路径,用“/”来划分路径。
    当路径为Gameobject中的相应位置时候,还可以在Hierarchy中右键点出。
    当路径为“CONTEXT”后接组件名字的时候,是可以在组件的右键列表中添加按钮。

  2. validate(bool)
    这个是用来控制emunitem的可点击事件。一般来说我们都是不需要检测是够需要点击。但是有的时候当我们需要对一个object做判断,来规避一些错误。当这个object不是我们所需要的是object的时候,我们可以通过返回一个false来控制item的点击。示例代码:

    [MenuItem("GameObject/item",true,10)]
    static bool item(Menucommand menuCommand){
    if(menuCommand.context != null){
        return true;
    }else{
        return false;
    }
    }
    [MenuItem("GameObject/item",false,10)]
    static void item1(Menucommand menuCommand){
    Debug.Log(menuCommand.ToString());
    }

    如上所示,需要itemname为一致,配套使用,返回值为false的时候,item会灰掉不能点击。点击所走的方法为validate为false的。

  3. priority(int)
    当两个itemname的priority的值大于10的时候,将创建分割线。数值越大,越靠近列表的最下。相同itemname的调用的是priority最大的。

[c#基础]浅析c#Dictionary实现原理

引用原文 https://www.cnblogs.com/InCerry/p/10325290.html

前言

对于c#中的Dictionary类相信大家都不陌生,这是一个Collection(集合)类型,可以通过Key/Value(键值对)的形式来存放数据;改类最大的优点就是它查询元素的时间复杂度接近o(1),实际项目中常被用来做一些数据的本地缓存,提升整体效率。
那个是什么样的设计能让Dictionary类实现o(1)的时间复杂度呢?这就是这篇文章想和大家讨论的东西;这些都是个人的一些理解和观点。

理论知识

对于Dictionary的实现原理,有两个关键的算法,一个是hash算法,一个是用于对hash碰撞冲突解决算法。

1,hash算法

Hash算法是一种数字摘要算法,它能将不定长度的二进制数据集给映射到一个较短的二进制长度数据集,常见的MD5算法就是一种Hash算法,通过MD5算法可对任何数据生成数字摘要。而实现了Hash算法的函数我们叫它Hash函数。Hash函数又以下几点特征:

  1. 相同的数据进行Hash运算,得到的结果一定相同。
    HashFunc(key1) == HashFunc(key1);
  1. 不同的数据进行Hash运算,其结果可能会相同(Hash会产生碰撞).key1 != key2 => HashFunc(key1) == HashFunc(key2)

  2. Hash运算时不可逆,不能由key获取原始的数据.key => HashFunc(key)但是HashFunc(key)=\=> key

散列函数还需要满足以下性质:

  1. 从数据到整数值(0~N-1)的映射

  2. 足够分散

  3. 不易冲突

“足够分散”是指,即使数据只有很小的差异,散列函数的计算也需要很大的差异。
“不易冲突”是指,不易发生不同的数据得到相同的散列值的情况。()
由于散列值的计算和指定索引访问数组元素所需要的时间都和数据的个数无关,所以散列表的访问计算量为o(1)。
下图就是Hash函数的一个简单的说明,任意长度的数据通过HashFunc映射到一个较短的数据集中。

关于Hash碰撞,下图很清晰的就解释了,可从图中得知Sandra DeeJohn Smith通过Hashfunc运算后都落在了02的位置,产生了碰撞和冲突。

常见的构造Hash函数的算法有以下几种。

  1. 直接寻址法:取keyword或keyword的某个线性函数值为散列地址。即H(key)=key或H(key)= a*key+b,当中a和b是常数(这样的散列函数叫做自身函数)

  2. 数字分析法:分析一组数据,比方一组员工的出生年月日,这时候我们发现出生年月日的前几位数字大体相同,这样话,出现冲突的几率就会非常大,可是我们发现年月日的后几位和详细日期的数字区分非常大,假设用后面的数字来构成散列地址,则冲突的几率会明显减少。因此数字分析法就是找出数字的规律,尽可能利用这些数据来构造冲突几率较低的散列地址。

  3. 平方取中法:去keyword平方后的中间几位作为散列地址。

  4. 折叠法:将keyword切割成位数同样的几部分,最后一部分位数能够不同,然后取这几部分的叠加值和(去除进位)作为散列地址。

  5. 随机数法:选择一随机函数,取keyword的随机值作为散列地址,通常使用于keyword长度不同的场合。

  6. 除留余数法:取keyword被某个不大于散列列表表长m的数p除后所得的余数为散列地址。即H(key) = key MOD p,p<=m,不仅能够对keyword直接取模,也可在折叠,平方取中等运算之后取模。对p的选择非常重要,一般取素数或m,若p选的不好,容易产生碰撞。

2,解决冲突算法

对于一个hash算法,不可避免会产生冲突,那么产生冲突以后如果处理,这是一个很关键的地方,目前常见的冲突解决算法有链地址法(chain-ing),开放地址法(open addressing),再Hash法,公共溢出分区法,本文主要介绍链地址法(也就是c#的Dictionary所采用的),和开放地址法。

1. 链地址法

是将拥有相同散列值的元素存放在链表中,因此随着元素个数的增加,散列冲突和查询链表的时间也跟着增加,也就造成了性能的损失。优点:元素的删除可以用比较简单且搞性能的方式来实现。

2. 开放地址法

是在遇到冲突的时候,寻找一个新的数据存放空间(一般称为槽)。寻找空闲槽最简单的方法,就是循序遍历,直到找到空闲槽为止。
开放地址法中,在访问数据时候,如果散列值所代表的位置(槽)中不存在所希望的数据,则要么代表数据不存在,要么代表由于散列冲突而被转存到别的槽中了。于是通过以下算法来寻找目标槽位:

  1. 计算数据(key)的散列值。
  2. 从散列值找到相应的槽位(如果散列值比槽的数量大则取余数)
  3. 如果槽位与数据一致,则使用该槽->查找结束。
  4. 如果槽位为空闲,则散列表中不存在改数据->查找结束
  5. 计算下一个槽的位置。
  6. 返回第三步进行循环。

由于开放地址在数据存放上使用的是相对简单的数组方式,和链表相比较所需要的内存空间更小,因此在性能上存在有利的一面。
但是它的缺点也很明显,相比于原本的散列冲突发生的概率来说,它会让散列冲突发生的更加频繁。因此在这个方法里,会把有冲突的数据存放在下一个槽里,这就意味着下一个槽无法用来存放原本和散列值直接对应的数据。
当存放数据的数组逐渐被填满时,冲突的发生会十分频繁。当发生冲突以后,就必须通过计算来求得下一个槽的位置,用于槽查找的处理时间就会逐渐增加。因此,在开放地址法的设计中,所使用的数组大小必须是留有一定余量。
还有删除也是比较麻烦的,一般的元素和因冲突而不在原位的元素是混在一起的。因此无法简单地删除某个数据,要删除数据,仅仅将删除对象的数据所在槽置为空闲是不够的。
这样可能会把开放地址法中的连锁切断,从而导致本来存在的数据无法被找到。因此要删除数据,必须要将存放改元素的槽设置为一种特殊的状态,即“空闲(允许存放新数据)但不中断对下一个槽的计算”。

结论

随着散列表中存放的数据越来越多,发生冲突的危险性也随之增加。假设真有一种理想的散列函数,对于任何数据都能求出完全不同的散列值,那么当元素个数超过散列列表中槽的个数时,就不可避免地会产生冲突。尤其是开放地址法中当槽快要被填满时,所引发的冲突问题更加显著。
无论采用哪种方法,一旦发生冲突,就必须沿着某种连锁来寻找数据,因此无法实现o(1)的查找效率。
因此,在实用的散列表实现中,当冲突对查找效率产生的不利影响超过某一程度,就会对表的大小进行修改,从而努力在平均水平上保持o(1)的超早效率。
即便在最好的情况下,重组操作所需要的计算量也至少和元素的个数相关(即o(n)),不过,只要将重组的频率尽量控制在一个很小的值,就可以将散列表的平均访问消耗水平维持在o(1)。

三,Dictionary实现

Dictionary实现我们主要对着源码来解析,目前对照的版本为.NET Farmework 4.8,源码地址链接Dictionary
这一章主要介绍Dictionary中几个比较关键的类和对象,然后跟着代码来走一遍插入,删除和扩容的流程,相信大家就能理解它的设计原理。

1.Entry结构体

首先我们引入Entry这样一个结构体,它的定义如下代码所示。这是Dictionary类存放数据的最小单位,调用Add(Key,Value)方法添加的元素都会被封装在这样的一个结构体里。

private struct Entry{
    public int hashCode;        //哈希码的低31位,如果没有被使用则为-1
    public int next;            //下一个Entry元素的下标索引,如果没有下一个则为-1
    public TKey key;            //存放元素的key
    public TValue value;        //存放元素的value
}

2.其它关键私有变量

除了Entry结构体以外,还有几个关键的私有变量,其定义和解释如下代码所示:

private int[] buckets;                          //Hash桶
private Entry[] entries;                        //Entry数组,存放元素
private int count;                              //当前entries的index位置,当freeCount为0时启用
private int version;                            //当前版本,防止迭代过程中集合被更改
private int freeList;                           //被删除Entry在entries中的下标index,这个位置是空闲的
private int freeCount;                          //有多少个被删除的Entry,有多少个空闲的位置
private IEqualityComparer<TKey> comparer;     //比较器,并且为object生成Hashcode
private KeyCollection keys;                     // 存放key的集合
private ValueCollection values;                 //存放value的集合

上面代码中,需要注意的是buckets,entries这两个数组,这是实现Dictionary的关键。

3.Dictionary-Add操作

正常的Add操作

经过上面的分析,相信大家还是不是特别明白为啥需要这样的设计。现在让我们先走一遍Dictionary的Add流程,来体会一下。
首先我们用图的形容来描述一个Dictionary的数据结构,其中只画出了关键的地方。桶大小为4以及Entry大小也是4的一个数据结构。

然后我们假设需要一个Add操作,dictionary.Add("a","b"),其中key = "a",value = "b".
大致的流程如下:

  1. 根据key的值,计算出它的hashCode。我们假设“a”的hash值为6(comparer.GetHashCode(key)).计算出来的hashCode和0x7FFFFFFF按位与(&)取底31位值,计算出的值为当前key的hashcode,假设为6。

  2. 通过hashcode和buckets的长度去余,计算出改hashCode落在哪一个buckets桶中。现在桶的长度(buckets.Length)为4,那么假设取到的值为2(6%4)所以index的值就是2,也就是落在buckets[2]这个桶中。

  3. 避开一种情况不谈,接下来它会将hashCode,key,value等信息存入entries[count]中,因为count位置是空闲的,所以值是可以放进去的;继续count++指向下一个空闲位置。上图中第一个位置,index = 0就是空闲,所以就存放在entries[0]的位置。

  4. Entry的下标entryIndex赋值给buckets中对应下标bucket。步骤3中是存放在entries[0]的位置,所以buckets[2]=0

  5. 最后version++,集合发生了变化,所以版本需要+1.只有增加,替换和删除元素才会更新版本

实际步骤和上文的步骤会有些出入,现在这样区分只是为了能方便大家理解,后续将更详细的补充
完成上面Add操作后,数据结构更新成了下图这样的形式。

这样是理想情况下的操作,一个bucket中只有一个hashCode没有碰撞产生,但是实际上是会经常发生碰撞的;下面说下Dictionary类中是如果解决碰撞的。

碰撞的Add操作

我们继续执行一个Add操作,dictionary.Add("c","d"),假设根据上面的步骤1所得到的值还是6,那么求余数还是2,最后桶的index也还是2,按照以前的步骤执行完以后数据结构如下图所示

如果继续执行步骤4那么buckets[2] = 1,然后原来的buckets[2]=>entries[0]的关系就会丢失,这是我们不能接受的,所以在这个时候Entry中的next就开始发挥作用。
如果对应的buckets[index]有其它的元素已经存在,那么会执行以下两条语句,让新的entry.next指向之前的元素,让buckets[index]指向现在新的元素,就构成了一个单链表。

entries[index].next = buckets[targetBucket];
...
buckets[targetBucket] = index;

实际上步骤4也就是做一个这样的操作,并不会去判断是不是有其它元素,因为buckets中捅的初始值就是-1,所以直接赋值不会出现问题。
经过上面的步骤以后,数据结构就更新成了下面这个样子。

4.Dictionary-Find操作

为了方便演示如果查找,我们继续Add一个元素dictionary.Add("e","f"),comparer.GetHashCode("e")=7;7% buckets.Length=3,数据结构如下所示。

假设我们现在执行这样一条语句dictionary.GetValueOrDefault("a"),就会执行以下步骤

  1. 获取key的hashCode,计算出所在的桶的位置。我们之前提到过,“a“的hashcode = 6,所以计算出来targetBucket=2。

  2. 通过buckets[2]=1找到entries[1],比较key的值是否相等,相等就返回entryindex,不相等就继续entries[next]查找,直到找到key相等元素或者next==-1的时候,这里我们找到了key=="a"的元素,返回entryindex = 0.

  3. 如果entryindex >= 0 那么返回对应的entries[entryindex]元素,否则返回default(TValue)。这里我们直接返回entries[0].value.
    整个查找过程如下图

    代码如下

    //寻找Entry元素的位置
    private int FindEntry(TKey key){
    if(key == null){
        ThrowHelper.ThrowArgumentNullException(ExceptionArgument.key);
    }
    if(buckets != null){
        int hashCode = comparer.GetHashCode(key)  & 0x7FFFFFFF; // 获取HashCode,忽略符号位
        // int i = buckets[hashCode % buckets.Length] 找到对应桶,然后获取entry在entries中位置
        // i >= 0; i = entries[i].next 遍历单链表
        for (int i = buckets[hashCode % buckets.Length]; i >= 0; i = entries[i].next) {
            // 找到就返回了
            if (entries[i].hashCode == hashCode && comparer.Equals(entries[i].key, key)) return i;
        }
    }
    return -1;
    }
    ...
    internal TValue GetValueOrDefault(TKey key){
    int i = FindEntry(key);
    // 大于等于0代表找到了元素位置,直接返回value
    // 否则返回该类型的默认值
    if (i >= 0) {
        return entries[i].value;
    }
    return default(TValue);
    }

    5.Dictionary-Remove操作

    前面介绍了增加,查找,接下来向大家介绍Dictionary是如何执行删除操作。我们沿用之前的Dictionary数据结构。

    删除前面的步骤和查找类似,也是需要找到元素的位置,然后再进行删除的操作。
    我们现在执行这样的一条语句dictionary.Remove("a"),hashFunc运算结果和上文中一致,步骤大部分与查找类似,我们直接看摘录的代码:

    public bool Remove(TKey key){
    if(key == null){
        ThrowHelper.ThrowArgumentNullException(ExceptionArgument.key);
    }
    if(buckets != null){
         // 1. 通过key获取hashCode
        int hashCode = comparer.GetHashCode(key) & 0x7FFFFFFF;
        // 2. 取余获取bucket位置
        int bucket = hashCode % buckets.Length;
        // last用于确定是否当前bucket的单链表中最后一个元素
        int last = -1;
          // 3. 遍历bucket对应的单链表
        for (int i = buckets[bucket]; i >= 0; last = i, i = entries[i].next) {
            if (entries[i].hashCode == hashCode && comparer.Equals(entries[i].key, key)) {
                // 4. 找到元素后,如果last< 0,代表当前是bucket中最后一个元素,那么直接让bucket内下标赋值为 entries[i].next即可
                if (last < 0) {
                    buckets[bucket] = entries[i].next;
                }
                else {
                    // 4.1 last不小于0,代表当前元素处于bucket单链表中间位置,需要将该元素的头结点和尾节点相连起来,防止链表中断
                    entries[last].next = entries[i].next;
                }
                // 5. 将Entry结构体内数据初始化
                entries[i].hashCode = -1;
                // 5.1 建立freeList单链表
                entries[i].next = freeList;
                entries[i].key = default(TKey);
                entries[i].value = default(TValue);
                // *6. 关键的代码,freeList等于当前的entry位置,下一次Add元素会优先Add到该位置
                freeList = i;
                freeCount++;
                // 7. 版本号+1
                version++;
                return true;
            }
        }
    }
    return false;
    }

    执行完上面代码后,数据结构就更新成了下图所示,需要注意的是version,freelist,freecount的值都被更新了。

    6.Dictionary-Resize操作(扩容)

    有细心的小伙伴可能看过了Add的操作以后就会想了,buckets,entries不就是两个数组嘛,万一数组被放满了那怎么办?接下来就是我要说的Resize(扩容)这种操作了,对我们的buckets,entries进行扩容。

    6.1扩容操作的触发条件

    首先我们需要知道在什么情况下,会发生扩容操作:第一种情况自然就是数组已经满了,没有办法继续存放新的元素。如下所示

    从上文中大家也知道了,Hash运算会不可避免的产生冲突,Dictionary中使用链地址法来解决冲突的问题,但是如果一直都在冲突那就会如下所示:

    所有的元素都刚好落在了buckets[3]上面,结果就是导致了时间复杂度0(n),查找性能就会下降;所以第二种,Dictionary中发生碰撞的次数太多,导致严重的性能问题,也会触发扩容操作。
    **目前.Net Framwork 4.8中设置的碰撞次数阈值为100.

    public const int HashCollisionThreshold = 100;

    6.2扩容操作如何进行

    为了给大家演示清楚,模拟了以下的这种数据结构,大小为2的Dictionary,假设碰撞的阈值为2;现在触发Hash碰撞扩容

    开始扩容操作

  4. 申请两倍于现在大小的buckets,entries

  5. 将现有的元素拷贝到新的entries

完成上面的两步操作后,新的数据结构如下图所示。

  1. 如果是Hash碰撞扩容,使用新的HashCode函数来重新计算hash值

上文提到了,这是发生了Hash碰撞扩容,所以需要使用新的Hash函数计算Hash值,新的Hash函数并不一定能解决碰撞的问题,可能还会更糟糕,像下图中一样还是会落在同一个bucket
上。

  1. 对entries每个元素bucket=newEntries[i].hashCode%newSize确定新的buckets位置

  2. 重建hash链,newEntries[i].next=buckets[bucket];buckets[bucket]=i;

因为buckets也扩容了两倍大小,所以需要重新确定hashCode在哪个bucket中;最后重新建立hash单链表。

这就完成了扩容的操作,如果是达到Hash碰撞阈值触发的扩容可能扩容后结果会更差。
在JDK中,HashMap如果碰撞的次数太多了,那么会将单链表转换为红黑树提升查找性能,目前在.Net Framwork中还没有这样的优化,.Net Core中已经有了类似的优化。
每次扩容操作都需要遍历所有元素,会影响性能。所以创建Dictionary实例时最好设置一个预估的初始大小。

private void Resize(int newSize,bool forceNewHashCodes){
    Contract.Assert(newSize >= entries.Length);
    //1.申请新的Buckets和entries
    int[] newBuckets = new int[newSize];
    for(int i = 0;i<newBuckets.Length;i++) newBuckets[i] = -1;
    Entry[] newEntries = new Entry[newSize];
    //2.将entries内元素拷贝到新的entries内
    Array.Copy(entries,0,newEntries,0,count);
    //3.如果是Hash碰撞扩容,使用新的HashCode函数重新计算Hash值
    if(forceNewHashCodes){
        for(int i = 0; i<count; i++){
            if(newEntries[i].hashCode != -1){
                newEntries[i].hashCode = (comparer.GetHashCode(newEntries[i].key) & 0x7FFFFFFF);
            }
        }
    }
    //4.确定新的bucket位置
    //5.重建Hash单链表
    for(int i = 0;i < count; i++){
        if(newEntries[i].hashCode >= 0){
            int bucket = newEntries[i].hashCode % newSize;
            newEntries[i].next = newBuckets[bucket];
            newBuckets[bucket] = i;
        }
    }
    buckets = newBuckets;
    entries = newEntries;
}

Dictionary-再谈Add操作

在我们之前的Add操作步骤中,提到了这样的一句话,这里提到会有一种其它的情况,那就是有元素被删除的情况。

  1. 避开一种其它情况不谈,接下来它会将hashCode,key,value等信息存入entries[count]中,因为count位置是空闲的;继续count++指向下一个空闲位置。上图中第一个位置,index=0就是空闲位置,所以就存在entries[0]的位置。

因为count是通过自增的方式来指向entries[]下一个空闲的entry,如果有元素被删除了,那么在count之前的位置就会出现一个空闲的entry位置,代码如下:

private void Insert(TKey key,TValue value,bool add){
    if(key == null){
        ThrowHelper.ThrowArgumentNullException(ExceptionArgument.key);
    }
    if(buckets == null)Initialize(0);
    //通过key获得hashCode
    int hashCode = comparer.GetHashCode(key) & 0x7FFFFFFF;
    //计算出目标bucket下标
    int targetBucket = hashCode%buckets.Length;
#if FEATURE_RANDOMIZED_STRING_HASHING
    //碰撞次数
    int collisionCount = 0;
#endif
    for(int i = buckets[targetBucket];i>= 0;i = entries[i].next){
        if(entries[i].hashCode == hashCode&&comparer.Equals(entries[i].key,key)){
            //如果增加操作,遍历到相同的元素,那么抛出异常
            if(add){
                ThrowHelper.ThrowArgumentException(ExceptionResource.Argument_AddingDuplicate);
            }
            //如果不是增加操作,那可能是索引赋值操作
            //赋值成功版本加一后退出
            entries[i].value = value;
            version++;
            return;
        }
#if FEATURE_RANDOMIZED_STRING_HASHING
        //遍历一次元素,都是一次碰撞
        collisionCount++;
#endif  
    }
    int index;
    //如果有被删除的元素,那么将元素放在被删除元素的空闲位置
    if(freeCount > 0){
        index = freeList;
        freeList = entries[index].next;
        freeCount--;
    }else{
        //如果当前的entries已满,那么出发扩容
        if(count == entries.Length){
            Resize();
            targetBucket = hashCode%buckets.Length;
        }
        index = count;
        count++;
    }
    //给entry赋值
    entries[index].hashCode = hashCode;
    entries[index].next = buckets[targetBucket];
    entries[index].key = key;
    entries[index].value = value;
    buckets[targetBucket] = index;
    //版本号加一
    version++;
    #if FEATURE_RANDOMIZED_STRING_HASHING
#if FEATURE_CORECLR
            // In case we hit the collision threshold we'll need to switch to the comparer which is using randomized string hashing
            // in this case will be EqualityComparer<string>.Default.
            // Note, randomized string hashing is turned on by default on coreclr so EqualityComparer<string>.Default will 
            // be using randomized string hashing
            //如果碰撞次数大于设置的最大碰撞次数,那么出发hash碰撞扩容
            if (collisionCount > HashHelpers.HashCollisionThreshold && comparer == NonRandomizedStringEqualityComparer.Default)
            {
                comparer = (IEqualityComparer<TKey>) EqualityComparer<string>.Default;
                Resize(entries.Length, true);
            }
#else
            if(collisionCount > HashHelpers.HashCollisionThreshold && HashHelpers.IsWellKnownEqualityComparer(comparer))
            {
                comparer = (IEqualityComparer<TKey>) HashHelpers.GetRandomizedEqualityComparer(comparer);
                Resize(entries.Length, true);
            }
#endif // FEATURE_CORECLR

#endif
}

现在在看完整的Add代码,是不是很简单了。

8.Collection版本控制

在上文中提到过一个version这个变量,在每一次增加,修改,删除的时候,都会对这个变量做一次递增;那么这个变量存在的意义是什么呢?
首先来看一段代码的运行,先实例化一个Dictionary的实例,然后通过foreach来遍历该实例,在foreach的代码块中使用remove(key)来删除元素

结果就是抛出来System.InvalidOperationException:"Collection was modified...这样的异常,迭代过程中不允许集合出现变化。这个就是用version来实现版本控制。
我们开看下源码是怎么实现版本控制的

[Serializable]
public struct Enumerator: IEnumerator<KeyValuePair<TKey,TValue>>,IDictionaryEnumerator{
    private Dictionary<TKey,TValue> dictionary;
    private int version;
    private int index;
    internal Enumerator(Dictionary<TKey,TValue> dictionary, int getEnumeratorRetType) {
        this.dictionary = dictionary;
        //这个给版本号赋值
        version = dictionary.version;
        index = 0;
        this.getEnumeratorRetType = getEnumeratorRetType;
        current = new KeyValuePair<TKey, TValue>();
    }
    public bool MoveNext() {
        //这里看版本是否有修改
        if (version != dictionary.version) {
            ThrowHelper.ThrowInvalidOperationException(ExceptionResource.InvalidOperation_EnumFailedVersion);
        }
    }
}

所以在迭代开始的时候记录一下version,后续在每一次迭代过程中都会去检查。

[编程基础].NET中的c#stack和heap(四)

引用https://www.c-sharpcorner.com/article/C-Sharp-heaping-vs-stacking-in-net-part-iv/

本文中我们将研究垃圾收集(GC)以及保持应用程序有效运行的一些方法

标记

让我们从GC的角度来看这件事。如果我们负责“清除垃圾”,我们需要好好设计一个方案。首先,我们需要确定什么是垃圾,什么不是垃圾。
为了确定需要保留的内容,我们首先假设所有未使用的都是垃圾。想象一下,我们与两个好朋友住在一起, Joseph Ivan Thomas(JIT)和 Cindy Lorraine Richmond (CLR)。Joe和Cindy会跟踪他们在使用什么,并向我们提供他们需要保留的物品清单。我们将初始列表称为“root”列表,因为我们将其当成作用起点。我们将保留一个主列表,以图形化我们要保留的房间中所有物体的位置。使列表中的内容在正常工作时所需要的内容都添加到图表中。这也就是GC确定保留哪些内容的方式。它接受一个“Root”对象引用列表,以使其免受即时(JIT)编译器和公共语言运行时(CLR)的影响,然后递归搜索对象引用以构建应包含哪些内容的图形需要保留。
root包括:

  • 全局/静态指针。通过在静态变量中保留对对象的引用来确保它不会被垃圾回收。
  • 堆栈上的指针。我们不会想要去抛弃掉我们应用程序的线程仍然需要执行的东西。
  • CPU寄存器指针。CPU中内存地址指向的托管堆中的所有内容都应该要保留下来。

    从上图我们可以看到,从roots直接引用了我们托管堆中的object1和object5,而我们的object1引用了我们的object3,所以在递归搜索中,我们roots也引用到了object3,现在我们知道所使用到的物体后,下一步进行压缩。

    压缩

    现在我们已经标识了需要保留的物体对象,我们现在只需要移动下需要保留的对象,即可压缩空间。

    在我们的内存中,我们还不需要放置一个对象之前,我们就先清理空间,由于不需要object2,因此作为GC,我们将object3往下移动,固定在object1的附近,把object2给清理掉。

    接下来我们按照和上面一样的方式,把object5给复制下来。

    现在我们已经清理了所有的内容了,我们只需要写一个便签并将其放置在压缩堆的顶部即可让Claire知道新的对象放在哪里。

    了解GC的本质可以帮助您理解,移动对象是非常消耗的。所以我们可以减少所要移动的内容的大小,那么我们将改善下GC流程,因为复制的内容将减少。

    处理托管堆之外的东西

    作为负责垃圾收集的人,我们在打扫房间的时候遇见一个问题是如何清理掉汽车中的物体。清洁时,我们需要清洁的所有东西,如果笔记本电脑在家而电池在车里该怎么办呢?
    在某些情况下,GC需要执行代码以清理非托管资源,例如文件,数据库连接,网络连接等等。一种解决方法是通过终结器

    class Sample{
    ~Sample(){
        //
    }
    }

    在对象创建期间,所有带有终结器的对象都将添加到终结队列中,假设object1,4,5都具有终结器的话,并且位于终结队列中。让我们看看当应用程序不再引用object2和4并且做垃圾回收时候会发生什么。

    object2以通常方法处理掉,但是,当我们处理到object4的时候,GC看到它在终结队列中,然后就先不回收掉object4的所拥有的内存,而是移动object4并把它的终结器添加到名为freachable的特殊队列中。

    有一个专用线程用于执行freachable队列中的对象。一档终结器由对象4上的该线程执行了,它将从freachable队列中删除。然后只有这样,object4才能准备好被GC;

    然后,object4会在下一个GC循环中被回收掉。
    因此在我们的类中添加终结器会为GC增加工作量,这个消耗是非常昂贵的,并且会对垃圾回收的性能和程序产生不利的影响,仅在绝对确定需要终结器的时候才使用它们。
    更好的做法是确保清理非托管资源。可以想象,最好是显式关闭链接并且使用IDisposable接口进行清理,而不是尽可能的用终结器。

    IDisposable

    实现IDisposable的类再Dispose()方法(接口的唯一签名)中执行清除。因此如果我们有一个ResourceUser类而使用using来追踪finalizer,代码如下:

    public class ResourceUser{
    ~ResourceUser(){
        //
    }
    }

    我们可以用IDisposable作为实现相同功能的更好方法:

    public class ResourceUser:IDisposable{
    public void Dispose(){
        //
    }
    }

    IDisposable与using关键字集成在一起。在using块的末尾,对using()中声明的对象调用Dispose()。在using块之后不应引用该对象,因为该对象的本质上应被视为“已消失”并已准备好由GC清除。

    public static void DoSomething(){
    ResourceUser rec = new ResourceUser();
    using(rec){
        //
    }
    }

    还有一种写法是把对象放在using块中,这样从表面上看它更有意义,因为rec不在using块的范围以外可用。这种模式更符合IDisposible接口的意图

    public static void DoSomething(){
    using(ResourceUser rec = new ResourceUser()){
        //
    }
    }

    通过using()和实现IDisposible的类一起使用,我们可以执行清理操作,而不会通过强制终结对象来增加GC的额外开销。

    静态变量:当心

    class Counter{
    private static int s_Number = 0;
    public static int GetNextNumber(){
        int newNumber = s_Number;
        s_Number = newNumber + 1;
        return newNumber;
    }
    }

    如果两个线程同时调用GetNextNumber(),并且在s_Number之前都为newNumber分配了相同的值。
    则他们将返回相同的结果。word是确保一次仅一个线程可以访问代码块的一种方法。最佳的做法是:您应锁定尽可能少的代码,因为线程必须在队列中等待才能执行lock()块中的代码,并且效率低下。

    class Counter{
    private static int s_Number = 0;
    public static int GetNextNumber(){
        lock(typeof(Counter)){
            int newNumber = s_Number;
            newNumber += 1;
            s_Number = newNumber;
            return newNumber;
        }
    }
    }

    静态变量当心的第二种情况

    接下来,我们必须注意静态变量引用的对象。请记住,如何清理“roots”引用的任何内容。请看下面的例子:

    class Olympics{
    public static Collection<Runner> TryoutRunners;
    }
    class Runner{
    private string _fileName;
    private FileStream _fStream;
    public void GetStats(){
        FileInfo fInfo = new FileInfo(_fileName);
        _fStream = _fileName.OpenRead();
    }
    }

    因为Runner集合对于Olympics类是静态的,所以不仅将不释放集合中的对象让它们做垃圾回收(它们全部都是通过roots间接引用),并且您可能已经注意到,每次我们运行GetStats()时,Fileinfo都将打开文件。因为它没有关闭,也没有被GC释放,所以这段代码实际上的运行将是一场等待着发生的灾难。想象一下,我们有1000000个Runner在Olympics中。我们最终将会有许多不可收集的对象,每个对象都有一个开放的资源。

    单例模式

    保持现状不变的技巧是始终在内存中有一个使用程序类的实例。一种简单的方法就是使用GOF单例模式。应该谨慎的使用单例,因为它们确实是“全局变量”,并且在多线程应用程序中有很多让我们感到头疼和“奇怪”的行为,在这种情况下,不同的线程可能会改变对象的状态。如果我们使用单例模式(或任何全局变量),则我们应该能够证明其合理性。

    public class Earth{
    private static Earth _instance = new Earth();
    private Earth(){}
    public static Earth GetInstance(){return _instance;}
    }

    我们有一个私有的构造函数,因此只有Earth可以执行它的构造函数并制作一个Earth。我们有一个Earth的静态实例和一个获取实例的静态方法。该特定实现是线程安全的,因为CLR确保线程安全地创建静态变量。这是一种优雅的实现单例模式的方法。

    结论

    我们可以做以下的一些事情来提高GC性能:

    1. 清理。不要保留资源,确保关闭所有打开的链接,并尽快清理所有非托管对象。作为使用非托管对象的一般规则,请尽可能的延迟实例化并尽快清理。
    2. 不要过度引用。使用引用对象时候需要合理。请记住,我们的对象如果还活着,那它所引用的所有对象都不会被收集。当我们完成了类所引用的操作后,可以通过将引用设置为null来删除它。还有一个技巧是肩为使用的引用设置为自定义轻量级的NullObject,以避免获取空引用异常。启动GC时候引用到的文件越少,标记过程中的压力就越少。
    3. 使用finalizer很轻松,但是在GC时候代价却非常的大。我们只能在合理的情况下使用它们。如果我们使用IDisposible而不是finalizer,则效率是非常高的。因为可以通过一次GC就回收掉对象而不需要来两次GC。
    4. 把object和其子类放在一起。在GC上将大块内存复制到一起比较容易,而不是每次通过堆时都必须对堆进行碎片整理,因此我们声明一个由许多其他对象组成的对象时候,应该将他们尽可能的放在一起实例化。

[编程基础].NET中的c#stack和heap(三)

引用链接:https://www.c-sharpcorner.com/article/C-Sharp-heaping-vs-stacking-in-net-part-iii/

前言

在使用.NET框架的时候,我们可以不必主动担心内存管理和垃圾回收(GC),但是仍然要牢记内存管理和垃圾回收的机制,以优化应用程序的性能。另外,对内存管理的工作原理有一个基本的了解将有助于我们理解所编写程序中使用变量的行为。在这个文章中,我们将讨论堆中具有引用变量以及如何使用ICloneable修复引用变量引起的问题。

副本不是副本

为了清楚定义这个问题,我们来检查一下当堆上有一个值类型而不是堆上有一个引用类型的时候,会发生什么。首先,我们来定义一个值类型,采取一下的类和结构。我们有一个Dude类,其中包含Name元素和两个Shoe结构。我们有一个CopyDude()方法,可以轻松的制作一个新的Dudes。

public struct Shoe{
public string Color;
}
public class Dude{
public string Name;
public Shoe RightShoe;
public Shoe LeftShoe;
public Dude CopyDude(){
Dude newPerson = new Dude();
newPerson.Name = Name;
newPerson.LeftShoe = LeftShoe;
newPerson.RightShoe = RightShoe;
return newPerson;
}
public override string ToString(){
return (Name + ": Dude!,I have a"+RightShoe.Color+" shoe on my right foot , and a" + LeftShoe.Color+"on my left foot");
}
}

我们的Dude类是一个引用类型,因此shoe结构是该类的成员元素,所以它们都最终出现在堆上。

当我们执行以下方法时候:

public static void Main(){
Dude bill = new Dude();
bill.Name = "Bill";
bill.LeftShoe = new Shoe();
bill.RightShoe = new Shoe();
bill.LeftShoe.Color = Bill.RightShoe.Color = "Blue";
Dude Ted = Bill.CopyDude();
Ted.Name = "Ted";
Ted.LeftShoe.Color = Ted.RightShoe.Color = "Red";
Console.WriteLine(Bill.ToString());
Console.WriteLine(Ted.ToString());
}

输出为:
Bill:Dude!I have a Blue shoe on my right foot, and a blue on my left foot.
Ted:Dude!I have a Red shoe on my right foot, and a Red on my left foot.

如果将Shoe设置为引用类型会怎样呢?

public class Shoe{
    public string Color;
}

并且在Main()中运行完全相同的代码,看看我们的输入如何变化。
Bill:Dude!I have a Red shoe on my right foot, and a Red on my left foot.
Ted:Dude!I have a Red shoe on my right foot, and a Red on my left foot.
这显然是一个错误,但是你知道为什么会出现这样的错误吗?这就是我们最终在堆中得到的结果

因为我们使用的Shoe作为引用类型而不是值类型,并且在复制引用类型的内容时仅仅复制了指针(而不是实际对象),所以我们必须做一些额外的工作来制作Shoe引用类型的行为像值类型。
刚好我们有一个可以帮我们实现这个方案的接口:ICloneable。这个接口基本是是所有Dudes都会用到的方法,并且定义了如何复制引用类型,以避免我们的“鞋子共享”错误。我们所有需要“clone”的引用类型都应该使用ICloneable接口,包括Shoe类。
ICloneable包含一种方法:Clone()

public object Clone(){
    //
}

这是我们在Shoe类中实现它的方式:

public class Shoe:ICloneable{
    public string Color;
    public object Clone(){
        Shoe newShoe = new Shoe();
        newShoe.Color = Color.Clone() as string;
        return newShoe;
    }
}

在clone()方法内部,我们仅制作了一个新的Shoe,克隆所有引用类型并复制所有值类型,然后返回新对象。string类已经实现了ICloneable,因此我们可以调用Color.Clone()方法,由于Clone()返回对象的引用,因此在设置鞋子颜色之前,我们必须“重新赋值”引用。
接下来我们的CooyDude()方法中,我们需要克隆鞋子而不是复制它们:

public Dude CopyDude(){
    Dude newPerson = new Dude();
    newPerson.Name = Name;
    newPerson.LeftShoe = LeftShoe.Clone() as Shoe;
    newPerson.RightShoe = RightShoe.Clone() as Shoe;
    return newPerson;
}

现在,当我们运行Main时。

public static void Main(){
    Dude Bill = new Dude();
    Bill.Name = "Bill";
    Bill.LeftShoe = new Shoe();
    Bill.RightShoe = new Shoe();
    Bill.LeftShoe.Color = Bill.RightShoe.Color = "Blue";
    Dude Ted = Bill.CopyDude();
    Ted.Name = "Ted";
    Ted.LeftShoe.Color = Ted.RightShoe.Color = "Red";
    Console.WriteLine(Bill.ToString());
    Console.WriteLine(Ted.ToString());
}

打印出来:
Bill : Dude!, I have a Blue shoe on my right foot, and a Blue on my left foot
Ted : Dude!, I have a Red shoe on my right foot, and a Red on my left foot
这才是我们需要输出的内容。

总结

因此,作为常规方法,我们总是希望克隆引用类型并复制值类型。因此,本着减少额外影响的原则,我们来更进一步的清理Dude类以实现ICloneable。使用CopyDude()方法。

public class Dude:ICloneable{
    public string Name;
    public Shoe RightShoe;
    public Shoe LeftShoe;
    public override string ToString(){
        return(Name + ":Dude! I have a"+RightShoe.Color+" shoe on my right foot ,and a"+LeftShoe.Color+" on my left foot.");}
        public object Clone(){
            Dude newPerson = new Dude();
            newPerson.Name = Name.Clone() as string;
            newPerson.LeftShoe = LeftShoe.Clone() as Shoe;
            newPerson.RightShoe = RightShoe.Clone() as Shoe;
            return newPerson;
        }
}

然后我们在将Main()中的方法改成Dude.Clone()

public static void Main(){
    Dude Bill = new Dude();
    Bill.Name = "Bill";
    Bill.LeftShoe = new Shoe();
    Bill.RightShoe = new Shoe();
    Bill.LeftShoe.Color = Bill.RightShoe.Color = "Blue";
    Dude Ted = Bill.Clone() as Dude;
    Ted.Name = "Ted";
    Ted.LeftShoe.Color = Ted.RightShoe.Color = "Red";
    Console.WriteLine(Bill.ToString());
    Console.WriteLine(Ted.ToString());
}

输出如下:
Bill : Dude!, I have a Blue shoe on my right foot, and a Blue on my left foot.
Ted : Dude!, I have a Red shoe on my right foot, and a Red on my left foot.
输出的值如我们所预期的。
实际上,System.String类的赋值运算符(“=”符号)实际上就是克隆String,因此不必担心重复引用的问题,因此你必须主要到我们内存的膨胀。实际上由于字符串是引用类型,所以它实际上在图中应该指向堆中的另一个对象的指针,但是为了方便理解,我们把它显示成值类型

结论

通常我们计划复制对象,则应该实现(并使用)ICloneable这个接口,这使我们的引用类型可以在某种程度上模仿值类型的复制行为。由于值类型和引用类型分配内存的方式有所不同,因此跟踪我们要处理的变量类型非常重要。

[编程基础].NET中的c#stack和heap(二)

引用 https://www.c-sharpcorner.com/article/C-Sharp-heaping-vs-stacking-in-net-part-ii/

前言

使用.NET框架,我们不必主动考虑内存管理和垃圾回收(GC),但仍必须牢记内存管理和垃圾回收,以优化应用程序的性能。另外,对内存管理的工作原理有一个基本的了解将有助于解释我们在编写的每个程序中使用的变量的行为。在本文中,我将介绍将参数传递给方法时需要注意的一些行为。

参数,重点

这是代码执行过程中发生的情况的详细视图。在第一部分中,我们介绍了进行方法调用时发生的情况。现在让我们更详细的介绍一下。。。
当我们进行方法调用时,会发生以下的情况:

  1. 给堆栈上我们所执行的方法所需要的信息分配空间(称为堆栈框架)。这包括调用地址(指针),该地址基本上是GOTO指令,因此当线程完成运行我们的方法时,它知道要返回到哪里才能继续执行。
  2. 我们的方法参数被复制。这是我们需要更仔细研究的地方。
  3. 控制权传递给JIT'ted方法,线程开始执行代码,因此,我们有另外一种犯法,由“调用堆栈”上的堆栈帧表示。
public int AddFive(int pValue){
    int result;
    result = pValue + 5;
    return result;
}

使用的堆栈如下图所示

注意:这个方法不存在与堆栈中,在这里只作为参考来说明堆栈框架的开始。
和第一部分讨论的那样,根据参数的类型是引用类型还是值类型,对堆栈上的参数的处理方式将有所不同。值类型将被整体复制,引用类型将被复制引用。

传递值类型

这是传递值类型
首先,当我们传递值类型时,将分配空间,并将类型中的值复制到堆栈上的新空间。
示例代码:

class Class1
{
    public void Go(){
        int x = 5;
        AddFive(x);
        Console.WriteLine(x.ToString());
    }
    public int AddFive(int pValue){
        pValue += 5;
        return pValue;
    }
}

执行该方法时,将“x”的空间放置在堆栈上,其值为5。

接下来,将AddFive()放置在堆栈上,并为其参数留出空间,并从x逐位复制值。

当AddFive()完成执行后,线程将被传递回Go(),并且由于AddFive()已经完成,因此pValue本质上是已经被抛弃了的数据:

因此,我们的代码输出的值为“5”,其中的关键点是:传递给方法的任何值类型参数都是复本,我们依靠原始变量的值来拷贝。
要记住的一件事:如果我们传递一个非常大的值类型(列如一个非常大的结构)并将其传递给堆栈,则每次复制它的空间和处理周期都会非常消耗。堆栈没有无限的空间,就像往一个杯子里一直倒水,最后它就可能会溢出。struct是一个可以变得非常大的值类型,我们必须了解我们如何处理它。
这是一个很大的结构:

public struct MyStruct{
    long a,b,c,d,e,f,g,h,i,j,k,l,m;
}

看一下我们执行Go()并转到下面的DoSomething()方法时会发生什么:

public void Go(){
    MyStruct x = new MyStruct();
    DoSomething(x);
}
public void DoSomeThing(MyStruct pValue){
    //
}


这就能看到低效的地方了。想想一下,如果我们通过MyStruct数千次,你就可以知道它是怎么拖累你程序的效率了。
那我们改怎么改善上述问题呢?可以通过传递对原始值类型的引用,如下所示:

public void Go(){
    MyStruct x = new MyStruct();
    DoSomething(ref x);
}
public struct MyStruct{
    long a,b,c,d,e,f,g,h,i,j,k,l,m;
}
public void DoSomething(ref MyStruct pValue){
    //
}

这样,我们最终可以在内存中更加有效的分配对象。

通过引用传递值类型时,我们唯一需要注意的是,我们对值类型的值的访问。
pValue中的任何更改都将x中的值进行了修改。使用下面的示例代码

public void Go(){
    MyStruct x = new MyStruct();
    x.a = 5;
    DoSomething(ref x);
    Console.WriteLine(x.a.ToString());
}
public void DoSomething(ref MyStruct pValue){
    pValue.a = 12345;
}

上述代码的打印值为“12345”,因为pValue.a实际上使用的是原始数据x变量里的内存空间。

传递引用类型

作为引用类型的传递参数类似于在上一个示例中通过引用传递值类型。
如果我们需要使用值类型

public class MyInt{
    public int MyValue;
}

并且调用Go()方法,因为MyInt是引用类型,所以它会出现在堆上。

如果按照以下代码来执行Go()

public void Go(){
    MyInt x = new MyInt();
    x.MyValue = 2;
    DoSomething(x);
    Console.WriteLine(x.MyValue.ToString());
}
public void DoSomething(MyInt pValue){
    pValue.MyValue = 12345;
}

这个时候发生了以下的事情。

  1. 从对Go()的调用开始,变量x进入堆栈。
  2. 从对DoSomething()的调用开始,参数pValue进入堆栈。
  3. x的值(堆栈上MyInt的地址)被复制到pValue

因此,当我们使用pValue更改堆中MyInt对象的MyValue属性并稍后使用x引用堆上对象时,我们得到的值是“12345”。
所以有一个有趣的地方,当我们通过引用传递引用类型的时候会发生什么呢?
看看这个。如果我们有Thing类,Animal和Vegetable继承自它

public class Thing{

}
public class Animal:Thing{
    public int Weight;
}
public class Vegetable:Thing{
    public int Length;
}

然后再执行下面Go()方法:

public void Go(){
    Thing x = new Animal();
    Switcharoo(ref x);
    Console.WriteLine("x is Animal : "+(x is Animal).ToString());
    Console.WriteLine("x is Vegetable : "+(x is Vegetable).ToString());
}
public void Switcharoo(ref Thing pValue){
    pValue = new Vegetable();
}

我们的x就变成的Vegetable。
如果不加ref那x还是Animal
让我们看看发生了什么;

  1. 从Go()方法调用开始,x指针进入堆栈
  2. Animal对象在堆上
  3. 对Switcharoo方法调用开始,pValue进入堆栈并指向x

  1. Vegetable在堆上
  2. x的值通过pValue更改为Vegetable的地址。

如果不通过ref传递Thing,则保留对Animal引用的并从代码获得相反的结果。

[编程基础].NET中的c#stack和heap(一)

引用

https://www.c-sharpcorner.com/article/C-Sharp-heaping-vs-stacking-in-net-part-i/

前言

这段时间在巩固c#基础的时候,发现有些基础性的东西在以前是没有仔细去想过的,比如值类型,和引用类型的区分,究竟值类型保存在哪里,引用类型保存在哪里,两个究竟是啥区别。在说到这个问题的时候,我们需要巩固一下堆和堆栈的信息。这个知识点在前面讲GC的时候有带过一点,但是没有详细去了解过,所以现在开始做一次总结。

Stack 和 Heap 有什么区别

堆栈(stack)一般来负责跟踪代码中正在执行的内容(即所谓的“调用”)。而堆(Heap)一般来说负责跟踪我们的对象。
可以将堆栈想想成一系列盒子堆叠在一起。每次调用方法的时候,都是从顶部叠放一个盒子,从而跟踪应用程序中发生的事情。我们只能使用堆栈顶部盒子里面的内容。当我们完成顶部盒子里的后,我们就把这个盒子给丢掉并继续使用推上来的顶部盒子里的内容。堆是类似的,它的主要用途是保存信息,以便可以随时随地的访问堆中的任何内容。和堆栈相比堆没有任何访问限制
堆栈是自我维护的,这就意味着我们可以不用去管理它的内存情况,顶部的数据不再使用就丢弃掉。堆就必须去考虑垃圾回收的情况(GC)。

以上图片并不是内存中真实的表现形式,但是能够帮助我们区分堆栈和堆。

堆栈和堆上发生了什么

我们将在执行代码时将四种主要类型的东西放入堆栈和堆中:值类型,引用类型,指针和指令。

值类型

在c#中,使用以下类型声明列表表明的所有“事物”均为值类型(因为它们来自System.ValueType):

  • bool
  • byte
  • char
  • decimal
  • double
  • enum
  • float
  • int
  • long
  • sbyte
  • short
  • stuct
  • uint
  • ulong
  • ushort

    引用类型

    所有被声明为以下类型的事物都被称为引用类型:

  • class
  • interface
  • delegate
  • object
  • string

    指针

    放在内存管理方案“事件”的第三种类型是对类型的引用。引用通常被称为指针。在c#中尽量不要明确使用指针,他们是由公共语言运行时(CLR)管理的。指针(或引用)与引用类型的不同之处在于,当我们说某个对象是引用类型时,意味着我们能够通过指针访问它。指针是内存中的一大块空间,指向内存中的另一个空间。指针占用的空间与我们放入堆栈和堆中的其他任何东西一样。其值可以是内存地址或null。

    指针是可以在堆栈中也可以在堆中的。

    如何决定是放在哪里的

    这是我们的两个黄金法则:

    1. 引用类型总放在堆上。
    2. 值类型和指针总是放在声明它们的地方。
      正如我们前面提到的,堆栈(stack)负责跟踪代码执行过程中每个线程的位置。您可以将其视为线程“状态”,并且每个线程都有自己的堆栈。当我们的代码调用执行一个方法时,线程开始执行经过JIT编译并存放在于方法表中的指令,它还将方法的参数放在线程堆栈中。然后当我们遍历代码并在方法中遇到变量时,将它们放置在堆栈的顶部。

      public int AddFive(int pValue){
      int result;
      result = pValue + 5;
      return result;
      }

      这是堆栈顶部的情况。在查看的内容已经位于堆栈的的其他项目之上了。
      一旦执行executin ghte方法,该方法的参数将被放置在堆栈上。
      注意
      该方法不存在与堆栈中,仅作参考说明

      首先入栈的是方法体,然后入栈我们方法的参数。
      将控制(执行该方法的线程)传递给位于我们类型方法表中的AddFive()方法的指令,如果这是我们第一次点击该方法,将执行JIT编译

      该方法执行时,我们使用一些内存来存储“结果”变量,并将其分配在堆栈上。

      该方法完成执行并返回我们的结果。

      通过将指针移到AddFive()开始的可用内存地址来清理堆栈上分配的所有内存,然后我们转到堆栈上的上一个方法。

      在此实例中,我们的“结果”变量被放置在堆栈上。事实上,每次在方法主体中声明值类型时,它将被放置在堆栈中。
      现在,值类型有时也放置在堆上。在规则中:值类型总是去声明它们的地方。所以,如果在方法外部但是在引用类型内部声明了值类型,那么将其放置在堆的引用类型内。
      现在来看另一个例子:
      如果我们定义以下的MyInt类:

      public class MyInt{
      public int MyValue;
      }

      并且正在执行以下方法:

      public MyInt AddFive(int pValue){
      MyInt result = new MyInt();
      result.MyValue = pValue + 5;
      return result;
      }

      与之前一样,线程开始执行该方法,并且其参数被放置在该线程的堆栈中。

      现在开始变得有趣了。
      由于MyInt是引用类型,因此将其放置在堆上,并且由堆栈上的指针引用。

      在AddFive()完成执行之后,我们正在清理

      我们在堆中只剩下一个孤零零的MyInt(堆栈中不再有任何人指向MyInt)

      这个时候就是垃圾回收集(GC)发挥作用的地方。一单程序达到一定内存阈值并且需要更多的堆空间时候,便会启动GC。GC将停止所有正在运行的线程(FULL STOP),在堆中找到主程序未访问的所有对象并将其删除。然后,GC将压缩堆中剩余的所有对象以腾出空间,并调整指针指向堆栈和堆中的这些对象。可以想象,这在性能方面可能是非常昂贵的。因此现在您可以了解为什么在尝试编写高性能代码时,注意堆栈和堆中内容是很重要。
      那这是怎么影响我的呢?
      当使用引用类型时,我们要处理类型的指针,而不是该类型本身。当我们使用值类型时,我们使用的是值类型本身。这是不是十分明确呢?
      那我们看下实例代码
      如果我们执行以下方法:

      public int ReturnValue(){
      int x = new int();
      x = 3;
      int y = new int();
      y = x;
      y = 4;
      return x;
      }

      这上面返回的值是3,这个很简单对吧。
      但是我们如果使用的是MyInt类:

      public class MyInt{
      public int MyValue;
      }

      并且我们正在执行以下方法:

      public int ReturnValue2(){
      MyInt x = new MyInt();
      x.MyValue = 3;
      MyInt y = new MyInt();
      y = x;
      y.MyValue = 4;
      return x.MyValue;
      }

      现在我们得到的返回值是几呢:是4。
      可能有人想不通为啥这个值是4
      我们先来先第一个例子中的内存图

      后面我们看下第二个例子的内存图,因为x,y都是指向堆中的同一个对象,所以我们就没办法获得3

      希望以上内容能使您更好的了解c#中“值类型”和“引用类型”变量之间的基本区别,以及对什么是指针以及何时使用它的基本理解。